Exemplo de regressão linear múltipla

1. Exemplo de histórico

Suponha que [profissionalismo] [velocidade de resposta] [dias ativos do grupo de usuários] esses três fatores afetem conjuntamente [pontuação de recomendação]
insira a descrição da imagem aqui

2. Objetivos da missão

Treine um modelo para prever [pontuação de recomendação] com base em [profissionalismo] [velocidade de resposta] [dias ativos do grupo de usuários]

3. Implementação de aprendizado de máquina

1. Etapas principais

Realize todo o processo:

insira a descrição da imagem aqui

1.1 Construção de modelo

O objetivo da tarefa é realizar a previsão de valores reais, e existem 3 fatores que afetam a [pontuação recomendada]: Portanto, um " modelo de regressão múltipla " deve ser estabelecido
no sklearn, seja uma regressão linear unária ou múltipla, a equação de regressão linear real é estabelecida, então O código principal para construir o modelo é

# 1. 建立模型:逻辑回归模型
classifier = linear_model.LinearRegression()

1.2 Modelo de Aprendizagem

1) Determine a função de perda: o método dos mínimos quadrados
2) A maneira ideal de resolver o índice de cálculo: o sklearn usa como padrão o método de solução analítica de derivação

# 2. 学习模型
classifier.fit(X,Y) 

1.3 Modelo de Medição

Os indicadores de medição do modelo de regressão logística-classificação são: R²
O código principal é o seguinte:

# 3. 衡量模型
r2 = reg.score(X,Y)

2. Código

from sklearn import linear_model
import pandas as pd
import matplotlib.pyplot as plt

# 获取所需数据:'推荐分值', '专业度','回复速度','用户群活跃天数'
datas = pd.read_excel('./datas1.xlsx')
important_features = ['推荐分值', '专业度','回复速度','用户群活跃天数']
datas_1 = datas[important_features]

# 明确实值Y为'推荐分值',X分别为'专业度','回复速度','用户群活跃天数'
Y = datas_1['推荐分值']
X = datas_1.drop('推荐分值',axis=1)

# 1. 建立模型
reg = linear_model.LinearRegression()

# 2. 学习模型
reg.fit(X,Y)
w = reg.coef_
b = reg.intercept_

# 3. 衡量模型
r2 = reg.score(X,Y)


# 输出模型最优状态下的参数W和b,R²分数
for index,value in enumerate(zip(X.columns,w)):
    print(f"【{
      
      value[0]}】参数w{
      
      index+1}:",value[1])
print("偏差b,或参数w0:",b)
print("多元线性回归模型的r²分数为:",r2)

3. Saída

insira a descrição da imagem aqui

Acho que você gosta

Origin blog.csdn.net/weixin_50348308/article/details/130845820
Recomendado
Clasificación