机器学习-数据科学库：Pandas总结（3）

其他 2021-01-30 08:06:44 阅读次数: 0

机器学习-数据科学库：Pandas总结（2）

Pandas数据分析项目练习

Pandas数据分析项目练习

现在我们有北上广、深圳、和沈阳5个城市空气质量数据，请绘制出5个城市的PM2.5随时间的变化情况。

数据来源： https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities

代码示例：画出北京和成都，其他城市方法相同。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df_beijing = pd.read_csv("./BeijingPM20100101_20151231.csv")
df_chengdu = pd.read_csv("./ChengduPM20100101_20151231.csv")
df_guangzhou = pd.read_csv("./GuangzhouPM20100101_20151231.csv")
df_shanghai = pd.read_csv("./ShanghaiPM20100101_20151231.csv")
df_shenyang = pd.read_csv("./ShenyangPM20100101_20151231.csv")

# print(df_beijing.info())
# print(df_chengdu.info())
df_beijing["timstamp"] = pd.PeriodIndex(year=df_beijing["year"], month=df_beijing["month"], day=df_beijing["day"], hour=df_beijing["hour"], freq="H")
df_chengdu["timstamp"] = pd.PeriodIndex(year=df_beijing["year"], month=df_beijing["month"], day=df_beijing["day"], hour=df_beijing["hour"], freq="H")

# print(df_beijing.info())

df_beijing.set_index("timstamp", inplace=True)
df_chengdu.set_index("timstamp", inplace=True)

_x1 = df_beijing["PM_Dongsi"].resample("7D").mean().dropna().index
_y1 = df_beijing["PM_Dongsi"].resample("7D").mean().dropna()
_x2 = df_chengdu["PM_Caotangsi"].resample("7D").mean().dropna().index
_y2 = df_chengdu["PM_Caotangsi"].resample("7D").mean().dropna()


_x1 = [i.strftime("%Y%m%d") for i in _x1]
_x2 = [i.strftime("%Y%m%d") for i in _x2]

print(len(_x1),len(_y1))
print(len(_x2),len(_y2))

#设置字体和负号的代码
plt.rcParams['font.sans-serif']=['Microsoft YaHei']
plt.rcParams['axes.unicode_minus'] = False

#绘图风格
plt.style.use('ggplot')

#图片大小
plt.figure(figsize=(20,8), dpi = 80)

plt.plot(range(len(_x1)), _y1, label="beijing")
plt.plot(range(len(_x2)), _y2, label="chengdu")


plt.xticks(range(0,len(_x1),10), _x1[::10], rotation=45)

plt.legend(loc="best")

plt.show()

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_45031468/article/details/112859562

机器学习-数据科学库：Pandas总结（3）

机器学习-数据科学库：Pandas总结（2）

机器学习-数据科学库：Pandas总结（1）

Pandas数据科学库学习总结

机器学习-数据科学库：numpy总结

机器学习-数据科学库：matplotlib总结

机器学习---数据科学包---pandas索引

机器学习---数据科学包---pandas索引

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（一）

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（二）

机器学习-数据科学库：matplotlib绘图

程序员用于机器学习数据科学的3个顶级 Python 库

机器学习：pandas库

机器学习——Pandas库

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（四）DataFrame数据结构

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（三）Series数据结构

Gradio 机器学习和数据科学开源 Python 库

科学数据库----Pandas基础+进阶

科学数据库----Pandas高级篇

数据科学库笔记（四）pandas

机器学习之Pandas库

机器学习入门（二）数据分析处理库pandas

科学计算库学习总结

Python数据分析与机器学习-Pandas_3

科学计算库pandas

机器学习——科学计算库numPy

【A-002】python数据分析与机器学习实战-Python科学计算库-Numpy科学计算库

python数据分析 pandas库的学习（3）

数据科学包——pandas

数据科学和机器学习与云计算数据库的相辅相成

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)