机器学习使用sklearn进行模型训练、预测和评价 - 代码天地

机器学习使用sklearn进行模型训练、预测和评价

其他 2018-12-21 10:31:18 阅读次数: 0

cross_val_score(model_name, x_samples, y_labels， cv=k)

作用：验证某个模型在某个训练集上的稳定性，输出k个预测精度。

K折交叉验证（k-fold）

把初始训练样本分成k份，其中（k-1）份被用作训练集，剩下一份被用作评估集，这样一共可以对分类器做k次训练，并且得到k个训练结果。

1 from sklearn.model_selection import cross_val_score
2 clf = sklearn.linear_model.LogisticRegression()
3 # X:features  y:targets  cv:k
4 cross_val_score(clf, X, y, cv=5)

模型的训练、预测和评价

 1 def svm_model():
 2     from sklearn.metrics import accuracy_score
 3     from sklearn.metrics import precision_score, recall_score, f1_score
 4     from sklearn.svm import SVC
 5     # 模型训练
 6     clf = SVC(kernel='linear')
 7     clf.fit(x_train_samples, y_train_labels)
 8     # 模型存储
 9     joblib.dump(clf, './model/svm_mode.pkl')
10     # 模型评估
11     predict_labels = clf.predict(x_test_samples)
12     Accuracy = accuracy_score(y_test_labels, predict_labels)
13     Precision = precision_score(y_test_labels, predict_labels, pos_label=0)
14     Recall = recall_score(y_test_labels, predict_labels, pos_label=0)
15     F1_scores = f1_score(y_test_labels, predict_labels, pos_label=0)

整个过程结束。需要说明的是调用K折交叉验证，结果输出的是准确率，其它的指标不会输出。所以，建议还是前期，使用train_test_split()函数划分训练集和验证集，后期根据实际需求评估模型

猜你喜欢

转载自www.cnblogs.com/demo-deng/p/10154222.html

机器学习使用sklearn进行模型训练、预测和评价

机器学习之使用sklearn代码进行交叉验证模型

TensorFlow学习实践（一）：使用TFRecord格式数据和队列进行模型训练和预测

机器学习-训练模型的保存与恢复（sklearn）

机器学习——Java调用sklearn生成好的Logistic模型进行鸢尾花的预测

sklearn学习--读取mysql数据源进行训练样本和预测文本分类

使用keras模型和sklearn库做机器学习任务

机器学习-训练模型的保存与恢复（sklearn）模型保存（pickle模块和joblib模块）

使用TF保存模型，恢复模型; 使用训练好的模型进行预测和特征提取

TensorFlow学习实践（二）：使用TFRecord格式数据和tf.data API进行模型训练和预测

TensorFlow学习实践（三）：使用TFRecord格式数据和tf.estimator API进行模型训练和预测

使用 Databricks+Mlflow 进行机器学习模型的训练和部署

尝试使用sklearn自动进行多模型预测并计算权重

使用sklearn进行鸢尾花分类预测模型：LogisticRegression

Tensorflow保存模型，恢复模型，使用训练好的模型进行预测和提取中间输出（特征）

机器学习回归任务指标评价及Sklearn神经网络模型评价实践

使用sklearn进行机器学习，数据挖掘

机器学习模型的评价指标和方法

机器学习模型的评价

探索人工智能 | 模型训练使用算法和数据对机器学习模型进行参数调整和优化

sklearn中机器学习算法评价指标

pytorch进阶学习（八）：使用训练好的神经网络模型进行图片预测

机器学习训练的评价指标

机器学习实战8-基于XGBoost和LSTM的台风强度预测模型训练与应用

如何选择合适的机器学习算法和模型？如何进行模型的训练和评估？

机器学习-Python中训练模型的保存和再使用

Keras 使用：加载已经训练好的模型进行预测

【Pytorch】使用训练好的模型进行图像分类预测

如何使用PySpark来利用机器学习模型对流数据进行预测？

Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)