Algoritmos de classificação e previsão comumente usados
Nome do algoritmo | Descrição do algoritmo |
---|---|
Análise de regressão | A análise de regressão é o método estatístico mais usado para determinar a relação quantitativa entre os atributos previstos (numéricos) e outras variáveis. Incluindo: regressão linear, regressão não linear, regressão logística, regressão de cume, regressão de componente principal, regressão de mínimos quadrados parciais e outros modelos. |
Árvore de decisão | A árvore de decisão usa um método recursivo de cima para baixo para comparar valores de atributo em nós internos e se ramifica a partir do nó de acordo com diferentes valores de atributo.Os nós folha resultantes são aprendidos a classificar. |
Rede neural artificial | Rede neural artificial é um sistema de processamento de informações que imita a estrutura e a função da rede neural do cérebro e representa o modelo da relação entre variáveis de entrada e saída da rede neural |
Rede Bayesiana | A rede bayesiana, também conhecida como rede de crenças, é uma extensão do método Bayes e um dos modelos teóricos mais eficazes no campo da representação e raciocínio incertos do conhecimento. |
Máquina de vetores de suporte | A máquina de vetores de suporte é um algoritmo que transforma separabilidade não linear de baixa dimensão em separabilidade linear de alta dimensão através de algum tipo de mapeamento não linear e executa análises lineares no espaço de alta dimensão |
Análise de regressão
Classificação do modelo de regressão principal
Nome do modelo de regressão | Condições aplicáveis | Descrição do algoritmo |
---|---|---|
Regressão linear | A variável dependente é independente da variável independente | Modele a relação linear entre uma ou mais variáveis independentes e dependentes e use o método dos mínimos quadrados para resolver os coeficientes do modelo |
Regressão não linear | As variáveis dependentes e independentes não são todas lineares | Modele o relacionamento não linear entre uma ou mais variáveis e a variável dependente. Se o relacionamento não linear puder ser transformado em um relacionamento linear por meio de uma simples transformação de função, use a idéia de regressão linear; se não puder ser convertida, use o método não linear de mínimos quadrados para resolver. |
Regressão logística | A variável dependente geralmente possui dois valores de 1 e 0 (independentemente ou não) | É um caso especial do modelo de regressão linear generalizada.A função logística é usada para controlar o intervalo da variável dependente entre 0 e 1, indicando a probabilidade do valor de 1. |
Regressão de Ridge | Multicolinearidade entre variáveis independentes envolvidas na modelagem | É um método aprimorado de estimativa de mínimos quadrados |
Regressão do componente principal | Multicolinearidade entre variáveis independentes envolvidas na modelagem | A regressão de componentes principais baseia-se na idéia de análise de componentes principais, que é uma melhoria do método dos mínimos quadrados e é uma estimativa tendenciosa da estimativa de parâmetros. A multicolinearidade entre variáveis independentes pode ser eliminada. |
O modelo de regressão linear é um modelo de regressão relativamente simples, mas geralmente existe uma certa relação de curva entre a variável dependente e a variável independente; é necessário estabelecer um modelo de regressão não linear.
Quando ocorrer multicolinearidade entre variáveis independentes, o coeficiente de regressão estimado por mínimos quadrados será impreciso, e os métodos de estimativa aprimorados dos parâmetros para eliminar a multicolinearidade incluem principalmente regressão de crista e regressão de componente principal.