数据分析之sklearn - 代码天地

数据分析之sklearn

其他 2019-03-10 18:36:41 阅读次数: 0

一，介绍

Python 中的机器学习库

简单高效的数据挖掘和数据分析工具
可供大家使用，可在各种环境中重复使用
建立在 NumPy，SciPy 和 matplotlib 上
开放源码，可商业使用 - BSD license

二，线性回归算法模型

2个概念

样本集：用于对机器学习算法模型对象进行训练。样本集通常为一个DataFrame。

- 特征数据：特征数据的变化会影响目标数据的变化。必须为多列。
- 目标数据：结果。通常为一列

1，建立线性回归算法模型对象

from sklearn.linear_model import LinearRegression
linear = LinearRegression()  # 实例化 线性回归算法模型对象

2，使用样本数据对模型进行训练

数据：
near_citys_dist： array([47,  8, 71, 14, 37], dtype=int64)  # 城市距离海边的最远距离
near_citys_max_temp： array([32.75, 32.79, 33.85, 32.81, 32.74])  # 城市的最高温度
# 使用这两组数据预测 城市温度与距离海边距离的关系
linear.fit(near_citys_dist.reshape(-1,1),near_citys_max_temp)  # 注意特征数据必须时多列，所以把array转化为多列的

返回值： LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

3，对模型进行精准度的评分

linear.score(near_citys_dist.reshape(-1,1),near_citys_max_temp)

# 0.5549063263099332

4，使用模型进行预测

x = np.array([65,44,12,99]).reshape(-1,1)  # 给定一组特征数据
y = linear.predict(x)   # 预测其值
# array([ 33.40442982,  33.10898974,  32.65879535,  33.88276137])

#绘制回归曲线
x = np.linspace(0,100,num=100)  # 给定一组特征数据
y = linear.predict(x.reshape(-1,1))  # 预测其值

plt.figure(figsize=(7,7))
plt.scatter(citys_dist,citys_max_temp)
plt.scatter(x,y)
plt.title('温度和距海洋距离关系')
plt.xlabel('距离')
plt.ylabel('温度')

猜你喜欢

转载自www.cnblogs.com/qq631243523/p/10506210.html

数据分析之sklearn

数据分析-sklearn包

数据分析师养成之路之keras篇(sklearn 与keras结合实现调参)

《封号码罗》数据分析与人工智能之sklearn梯度下降（九）

《封号码罗》数据分析与人工智能之sklearn回归问题（八）

sklearn库的-数据分析机器学习（1）

《封号码罗》数据分析与人工智能之sklearn模型LogisticRegression逻辑斯蒂回归（十三）

《封号码罗》数据分析与人工智能之sklearn模型评估和交叉表（十）

《封号码罗》数据分析与人工智能之sklearn模型Lasso岭回归（十二）

《封号码罗》数据分析与人工智能之sklearn模型Ridge岭回归（十一）

数据分析之matplotlib

数据分析之pandas

数据分析之numpy

数据分析之python

数据分析之期权

数据分析之anacod

Python之数据分析

python数据分析与算法之六数据分析

Python大数据分析之数据分析

数据分析入门之数据分析方法

数据分析之异常值分析

数据分析之对比分析

数据分析之线性回归分析

数据分析浅谈数据分析基础知识数据分析之numpy模块

Sklearn之聚类分析

数据分析之数据分类了解

数据分析与挖掘之数据规约

数据分析之数据采集

数据分析之Python数据导入

数据仓库之数据分析

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)