[Notas do aprendizado de máquina] Algoritmos de classificação e previsão comumente usados

Algoritmos de classificação e previsão comumente usados

Nome do algoritmo Descrição do algoritmo
Análise de regressão

A análise de regressão é o método estatístico mais usado para determinar a relação quantitativa entre os atributos previstos (numéricos) e outras variáveis.

Incluindo: regressão linear, regressão não linear, regressão logística, regressão de cume, regressão de componente principal, regressão de mínimos quadrados parciais e outros modelos.

Árvore de decisão A árvore de decisão usa um método recursivo de cima para baixo para comparar valores de atributo em nós internos e se ramifica a partir do nó de acordo com diferentes valores de atributo.Os nós folha resultantes são aprendidos a classificar.
Rede neural artificial Rede neural artificial é um sistema de processamento de informações que imita a estrutura e a função da rede neural do cérebro e representa o modelo da relação entre variáveis ​​de entrada e saída da rede neural
Rede Bayesiana A rede bayesiana, também conhecida como rede de crenças, é uma extensão do método Bayes e um dos modelos teóricos mais eficazes no campo da representação e raciocínio incertos do conhecimento.
Máquina de vetores de suporte A máquina de vetores de suporte é um algoritmo que transforma separabilidade não linear de baixa dimensão em separabilidade linear de alta dimensão através de algum tipo de mapeamento não linear e executa análises lineares no espaço de alta dimensão

Análise de regressão

Classificação do modelo de regressão principal

 

Nome do modelo de regressão Condições aplicáveis Descrição do algoritmo
Regressão linear A variável dependente é independente da variável independente Modele a relação linear entre uma ou mais variáveis ​​independentes e dependentes e use o método dos mínimos quadrados para resolver os coeficientes do modelo
Regressão não linear As variáveis ​​dependentes e independentes não são todas lineares Modele o relacionamento não linear entre uma ou mais variáveis ​​e a variável dependente. Se o relacionamento não linear puder ser transformado em um relacionamento linear por meio de uma simples transformação de função, use a idéia de regressão linear; se não puder ser convertida, use o método não linear de mínimos quadrados para resolver.
Regressão logística A variável dependente geralmente possui dois valores de 1 e 0 (independentemente ou não) É um caso especial do modelo de regressão linear generalizada.A função logística é usada para controlar o intervalo da variável dependente entre 0 e 1, indicando a probabilidade do valor de 1.
Regressão de Ridge Multicolinearidade entre variáveis ​​independentes envolvidas na modelagem É um método aprimorado de estimativa de mínimos quadrados
Regressão do componente principal Multicolinearidade entre variáveis ​​independentes envolvidas na modelagem A regressão de componentes principais baseia-se na idéia de análise de componentes principais, que é uma melhoria do método dos mínimos quadrados e é uma estimativa tendenciosa da estimativa de parâmetros. A multicolinearidade entre variáveis ​​independentes pode ser eliminada.

O modelo de regressão linear é um modelo de regressão relativamente simples, mas geralmente existe uma certa relação de curva entre a variável dependente e a variável independente; é necessário estabelecer um modelo de regressão não linear.

Quando ocorrer multicolinearidade entre variáveis ​​independentes, o coeficiente de regressão estimado por mínimos quadrados será impreciso, e os métodos de estimativa aprimorados dos parâmetros para eliminar a multicolinearidade incluem principalmente regressão de crista e regressão de componente principal.

 

 

发布了646 篇原创文章 · 获赞 198 · 访问量 69万+

Acho que você gosta

Origin blog.csdn.net/seagal890/article/details/105189389
Recomendado
Clasificación