【网络学习笔记】python数据分析笔记

目前的计划是10.25 - 11.25 一个月的时间学完这套课程。可能完不成,因为中间有概率统计的知识,差不多忘光了,需要再看数学消化消化。

说明:这套课程是使用python语言进行数据分析,目前已有python基础,python的面向对象内容在学习中,虽然还没写大的项目,但基本能看懂了。有爬虫的底子(老实说爬虫真的很烦,之所以想搞数据分析不想搞爬虫,感觉爬虫就是工具人= =)

推荐指数:☆☆☆☆☆
课程名:【python教程】数据分析——numpy、pandas、matplotlib

链接https://www.bilibili.com/video/BV1hx411d7jb

tips:应该说是打基础+提高综合的一套课程。黑马出品,质量还是可以滴!计划学完了能够在年前自己搞些数据分析的项目来写写。之前收藏了数据分析的网站,回头再来找一找~

学习日期:2020.10.25
P1-P5

第0节:
数据分析的流程:
1、提出问题
2‘、准备数据
3、分析数据
4、获得结论
5、成果可视化

第1节:
conda环境安装
1装了anaconda之后,再用conda安装东西很方便【比如scrapy一些包安装的时候】

第2节:
2、安装jupiter
使用jupiter编写简单代码。
疑问:为何爬虫类的用spider,数据分析这里用jupiter?

第3节:
3、matplotlib介绍
官方文档:https://matplotlib.org/contents.html

matplotlib是绘图工具,绘制散点图、直方图、柱状图等。
matplotlib仿照MATLAB,实现后者的功能。
案例:绘制温度图形

扫描二维码关注公众号,回复: 13123987 查看本文章

要点:
1、设置图片大小、线条颜色
2、增加文字、标题
3、保存图片等一些优化

from matplotlib import pyplot as plt

#设置图片大小;在图片模糊的时候传入dpi参数,让图形更清晰
fig = plt.figure(figsize = (20,8),dpi = 80)

x = range(2,26,2)
y = [15,13,14,15,17,20,25,26,26,24,22,18]
plt.plot(x,y)

#绘制x轴,y轴的刻度
_xticker_labels = [i/2 for i in range(4,45)]
plt.xticks(_xticker_labels[::3])
plt.yticks(range(min(y),max(y)+1))

#保存图片,svg是矢量图格式
plt.savefig("./sig_size.png")

#展示图片
plt.show()

图形:
在这里插入图片描述

学习日期:2020.10.26
主要是设置中文字体,有点折腾
代码:

import matplotlib
from matplotlib import font_manager
from matplotlib import pyplot as plt
import random

my_font = matplotlib.font_manager.FontProperties(fname=r'C:\Windows\Fonts\STZHONGS.TTF')

x = range(0,120)
y = [random.randint(20,35) for i in range(120)]

plt.figure(figsize=(20,8),dpi = 80)

plt.plot(x,y)

_xticker = ["10点{}分".format(i) for i in range(60)] + ["11点{}分".format(i) for i in range(60)]

#把字体加进去,rotation是旋转角度,顺时针
plt.xticks(list(x)[::3],_xticker[::3],rotation = 90,fontproperties = my_font)
plt.show()

在这里插入图片描述
学习日期:2020.11.06
添加图片描述信息,把中文参数传进去。

import matplotlib
from matplotlib import font_manager
from matplotlib import pyplot as plt
import random

my_font = matplotlib.font_manager.FontProperties(fname=r'C:\Windows\Fonts\STZHONGS.TTF')

x = range(0,120)
y = [random.randint(20,35) for i in range(120)]

plt.figure(figsize=(20,8),dpi = 80)

plt.plot(x,y)

_xticker = ["10点{}分".format(i) for i in range(60)] + ["11点{}分".format(i) for i in range(60)]

#把字体加进去,rotation是旋转角度,顺时针
plt.xticks(list(x)[::3],_xticker[::3],rotation = 90,fontproperties = my_font)
#添加描述信息
plt.xlabel("时间",fontproperties = my_font)
plt.ylabel("温度 单位摄氏度",fontproperties = my_font)
plt.title("每分钟的时间变化",fontproperties = my_font)

plt.show()

练习:a和b每年交男女朋友的数目= =

学习日期:2020.11.13

# -*- coding: utf-8 -*-
from matplotlib import pyplot as plt
import matplotlib
from matplotlib import font_manager

my_font = font_manager.FontProperties(fname = "C:/WINDOWS/Fonts/MSYH.TTC")


y0 = [1,2,4,4,3,6,1,2,3,4,1,2,4,4,3,6,1,2,3,4]
y1 = [3,3,5,6,1,2,3,4,6,3,1,2,7,5,2,2,3,1,1,1]
x = range(11,31)

plt.figure(figsize=(20,8),dpi = 80)
#画两条线
plt.plot(x,y0,label = "自己")
plt.plot(x,y1,label = "同桌")

_xtick_labels = ["{}岁".format(i) for i in x]
plt.xticks(x,_xtick_labels,fontproperties = my_font)
plt.yticks(range(0,9))

#绘制网格
#调整透明度
plt.grid(alpha = 0.4)

#添加图例
plt.legend(prop = my_font,loc = "upper left")

plt.show()

说明:关于matplotlib的一些使用,可以参考源码以及官网的一些模型代码。个人感觉这块不需要太多记忆,会看源码调试即可。

关于统计图形的使用,条形图、散点图,折线图等等,概念很基础。

猜你喜欢

转载自blog.csdn.net/weixin_42377217/article/details/109275674