1. Exemplo de histórico
Suponha que [profissionalismo] [velocidade de resposta] [dias ativos do grupo de usuários] esses três fatores afetem conjuntamente [pontuação de recomendação]
2. Objetivos da missão
Treine um modelo para prever [pontuação de recomendação] com base em [profissionalismo] [velocidade de resposta] [dias ativos do grupo de usuários]
3. Implementação de aprendizado de máquina
1. Etapas principais
Realize todo o processo:
1.1 Construção de modelo
O objetivo da tarefa é realizar a previsão de valores reais, e existem 3 fatores que afetam a [pontuação recomendada]: Portanto, um " modelo de regressão múltipla " deve ser estabelecido
no sklearn, seja uma regressão linear unária ou múltipla, a equação de regressão linear real é estabelecida, então O código principal para construir o modelo é
# 1. 建立模型:逻辑回归模型
classifier = linear_model.LinearRegression()
1.2 Modelo de Aprendizagem
1) Determine a função de perda: o método dos mínimos quadrados
2) A maneira ideal de resolver o índice de cálculo: o sklearn usa como padrão o método de solução analítica de derivação
# 2. 学习模型
classifier.fit(X,Y)
1.3 Modelo de Medição
Os indicadores de medição do modelo de regressão logística-classificação são: R²
O código principal é o seguinte:
# 3. 衡量模型
r2 = reg.score(X,Y)
2. Código
from sklearn import linear_model
import pandas as pd
import matplotlib.pyplot as plt
# 获取所需数据:'推荐分值', '专业度','回复速度','用户群活跃天数'
datas = pd.read_excel('./datas1.xlsx')
important_features = ['推荐分值', '专业度','回复速度','用户群活跃天数']
datas_1 = datas[important_features]
# 明确实值Y为'推荐分值',X分别为'专业度','回复速度','用户群活跃天数'
Y = datas_1['推荐分值']
X = datas_1.drop('推荐分值',axis=1)
# 1. 建立模型
reg = linear_model.LinearRegression()
# 2. 学习模型
reg.fit(X,Y)
w = reg.coef_
b = reg.intercept_
# 3. 衡量模型
r2 = reg.score(X,Y)
# 输出模型最优状态下的参数W和b,R²分数
for index,value in enumerate(zip(X.columns,w)):
print(f"【{
value[0]}】参数w{
index+1}:",value[1])
print("偏差b,或参数w0:",b)
print("多元线性回归模型的r²分数为:",r2)