[Notas do aprendizado de máquina] Algoritmos de classificação e previsão comumente usados

Algoritmos de classificação e previsão comumente usados

Nome do algoritmo	Descrição do algoritmo
Análise de regressão	A análise de regressão é o método estatístico mais usado para determinar a relação quantitativa entre os atributos previstos (numéricos) e outras variáveis. Incluindo: regressão linear, regressão não linear, regressão logística, regressão de cume, regressão de componente principal, regressão de mínimos quadrados parciais e outros modelos.
Árvore de decisão	A árvore de decisão usa um método recursivo de cima para baixo para comparar valores de atributo em nós internos e se ramifica a partir do nó de acordo com diferentes valores de atributo.Os nós folha resultantes são aprendidos a classificar.
Rede neural artificial	Rede neural artificial é um sistema de processamento de informações que imita a estrutura e a função da rede neural do cérebro e representa o modelo da relação entre variáveis de entrada e saída da rede neural
Rede Bayesiana	A rede bayesiana, também conhecida como rede de crenças, é uma extensão do método Bayes e um dos modelos teóricos mais eficazes no campo da representação e raciocínio incertos do conhecimento.
Máquina de vetores de suporte	A máquina de vetores de suporte é um algoritmo que transforma separabilidade não linear de baixa dimensão em separabilidade linear de alta dimensão através de algum tipo de mapeamento não linear e executa análises lineares no espaço de alta dimensão

Análise de regressão

Classificação do modelo de regressão principal

Nome do modelo de regressão	Condições aplicáveis	Descrição do algoritmo
Regressão linear	A variável dependente é independente da variável independente	Modele a relação linear entre uma ou mais variáveis independentes e dependentes e use o método dos mínimos quadrados para resolver os coeficientes do modelo
Regressão não linear	As variáveis dependentes e independentes não são todas lineares	Modele o relacionamento não linear entre uma ou mais variáveis e a variável dependente. Se o relacionamento não linear puder ser transformado em um relacionamento linear por meio de uma simples transformação de função, use a idéia de regressão linear; se não puder ser convertida, use o método não linear de mínimos quadrados para resolver.
Regressão logística	A variável dependente geralmente possui dois valores de 1 e 0 (independentemente ou não)	É um caso especial do modelo de regressão linear generalizada.A função logística é usada para controlar o intervalo da variável dependente entre 0 e 1, indicando a probabilidade do valor de 1.
Regressão de Ridge	Multicolinearidade entre variáveis independentes envolvidas na modelagem	É um método aprimorado de estimativa de mínimos quadrados
Regressão do componente principal	Multicolinearidade entre variáveis independentes envolvidas na modelagem	A regressão de componentes principais baseia-se na idéia de análise de componentes principais, que é uma melhoria do método dos mínimos quadrados e é uma estimativa tendenciosa da estimativa de parâmetros. A multicolinearidade entre variáveis independentes pode ser eliminada.

O modelo de regressão linear é um modelo de regressão relativamente simples, mas geralmente existe uma certa relação de curva entre a variável dependente e a variável independente; é necessário estabelecer um modelo de regressão não linear.

Quando ocorrer multicolinearidade entre variáveis independentes, o coeficiente de regressão estimado por mínimos quadrados será impreciso, e os métodos de estimativa aprimorados dos parâmetros para eliminar a multicolinearidade incluem principalmente regressão de crista e regressão de componente principal.

Coronel Mason

发布了646 篇原创文章 · 获赞 198 · 访问量 69万+

他的留言板关注