零基础python机器学习笔记--代码实战第二天数据分析 - 代码天地

零基础python机器学习笔记--代码实战第二天数据分析

其他 2019-03-06 14:42:37 阅读次数: 0

首先读取数据

#读取红酒数据
target_url = "https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv"
df = pd.read_csv(target_url, sep = ";")

#打印数据形状和数据类型的个数
print (df.shape)
print (df.get_dtype_counts())

数据释义：每一行代表一组数据，1-11列代表红酒不同属性的检测值，最后一列代表红酒质量指数，下面通过将质量指数映射到(0,1)区间，根据优劣程度对应到所画折线图的不同颜色（cm.RdYlBu函数：值越小越劣对应线条越红，反之越蓝），进而分析判断好酒劣酒在哪些质量指数数据上有差异。

判断鉴定红酒优劣的指标

##根据红酒质量的不同画不同颜色的折线
#1，将数据值标准化
_df = (df*1.0-df.mean())/df.std()
#2,将红酒质量指数映射到（0，1）范围内
q = df.shape[1]-1
dq = df.iloc[:,q]*1.0
_dq = (dq-dq.mean())/dq.std()
_dq = 1.0/(1.0+math.e**(-_dq))
#3,画图：偏蓝色代表质量较好的红酒；偏红色线表质量较差的红酒
plt.figure(figsize = (10,5))
for i in range(df.shape[0]):
    _df.iloc[i,1:q].plot(color=plt.cm.RdYlBu(_dq[i]), alpha = 0.5)
plt.xlabel(df.columns.tolist()[0:q])
plt.show()

在这里插入图片描述
通过观察结果图发现：较好的红酒酒精含量相对较高，密度相对较低，非挥发性酸含量相对较低。

分析各个属性间的关系
最后通过画热度相关图，分析各个属性间的关系：

#热度相关图，黄色对应强相关。
plt.pcolor(df.corr())
plt.show()

在这里插入图片描述
在上图的展示中，以第1个属性为例，通过热度图可以发现它和第3个、第8个属性（绿色方块）有着较强的相关性，即非挥发性酸值大的话，糖分残留和ph值就会大，这和我们的化学常识相一致，同时这也变相说明上一部分的推理挥发性酸值越大–>糖分残留值越大（口感越甜）的红酒相对较为劣质，这和我们的常识也是相一致的。

猜你喜欢

转载自blog.csdn.net/weixin_39860046/article/details/87992511

零基础python机器学习笔记--代码实战第二天数据分析

零基础python机器学习笔记--代码实战第一天数据分析

python零基础学习第二天

初学Python,零基础,第二天

java零基础学习第二天

零基础学Python|Python基础语法学习第二天

零基础学css第二天

Java零基础学习021-API进阶第二天

学习python第二天数据库day1

《机器学习》学习第二天（代码学习及其分析）

机器学习第二天

代码学习第二天笔记

python学习第二天笔记二，字典

【自学笔记】0基础自学机器学习（第二天）

（系列更新完毕）深度学习零基础使用 PyTorch 框架跑 MNIST 数据集的第二天：加载 MNIST 数据集

python的基础学习第二天

python第二天-Linux基础学习

python基础学习第二天

Python基础知识学习第二天

Python基础知识学习-第二天

零基础python机器学习笔记--线性回归--代码实战第三天

数据库基础学习第二天

python基础（第二天）

python基础第二天

第二天python 基础

（系列更新完毕）深度学习零基础使用 TensorFlow 框架跑 MNIST 数据集的第二天：训练模型

python学习笔记第二天

【python第二天学习笔记】

python学习第二天笔记六，练习

Python第二天学习笔记

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)