Python-数据分析-Matplotlib数据可视化

      学校开的选修课的复习笔记(内容大部分来自学校的PPT)

      需要一定统计学知识

1.绘图基础语法与常用参数

       基础绘图流程:       

  (1).创建画布与子图

plt.figure    #创建一个空白画布,可以指定画布大小 像素

figure.add_subject    #创建并选中子图,可以指定子图的行数、列数,与选中图像编号

plt.title   #添加标题 可以指定标题名称、位置、颜色、字体

plt.xlabel   #添加x轴名称,可以指定位置、颜色、字体大小等

plt.ylabel   #添加y轴名称,可以指定位置、颜色、字体大小等

plt.xlim   #指定x轴范围 只能确定一个数值区间,且无法使用字符串标识

plt.ylim   #指定y轴范围 只能确定一个数值区间,且无法使用字符串标识

plt.xticks #x轴刻度的数目与取值

plt.yticks #y轴刻度的数目与取值

plt.legend  #当前图形的图例,可以指定图例大小,位置,标签

plt.savagif  #保存绘制的图片 可以指定分辨率、边缘颜色等参数

plt.show   #在本机显示图形

(2).rc参数

       pyplot使用rc配置文件来自定义图形的各种默认属性,被称为rc配置或rc参数

       线条常用的rc参数名称、解释与取值

lines.linewidth         #线条宽度 取0-10之间的数值,默认为1.5

lines.linestyle         #线条样式: "-" "--" "-." ":" 默认为"-"

lines.marker            #线条上的形状 可取"o" "D" "h" "." ","等等 默认为None

lines.markersize        #点的大小 取0-10之间的数值 默认为1

      注意:

            (1).默认的pyplot不支持中文字符的显示,因此需要设置font.sans-serif,同时还要更改axes.unicode_minus

matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.pyplot.rcParams['axes.unicode_minus']=False

2.分析特征间的关系

      (1).散点图

           散点图又称为散点分布图,是以一个特征为横坐标,另一个特征为纵坐标,利用坐标点的分布形态反应也证件的统计关系的一种图形。

            matplotlib.pyplot.scatter(x,y,s=None,c=None,marker=None,alpha=None,**kwargs)

            x,y 接收array,表示x轴y轴对应的数据 s指点的大小,默认为None c指点颜色,默认为None

            marker为绘制点的类型,alpha表示点的透明度

      (2).折线图

            折线图是一种将数据点连接起来的图形,可以看作散点图按照x轴坐标顺序连接起来的图形。 

            matplotlib.pyplot.plot(*args)

            x,y x和y轴对应的数据 color指线条的颜色 linestyle 线条类型 marker指绘制点的类型 alpha指点的透明度

  3.分析特征内部数据分布与分散状况

        (1).直方图

              直方图又称质量分布图,是统计报告图的一种,由一系列高度不等的纵向条纹或线段表示数据分布情况,一般用横轴表示数据所属类别,纵轴表示数量或者占比。

             matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,data=None,**kwargs)

             left array,表示x轴数据

             height array,表示y轴数据

             width 接收0-1的float,直方图宽度,默认为0.8

             color 直方图颜色

      (2).饼图

             饼图是将各项的大小与各项总和的比例显示在一张饼中,以饼的大小来确定每一项的占比。

             matplotlib.pyplot.pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,

                                              shadow=False,labeldistance=1.1,startangle=None,radius=None,...)

plt.pie(x=plt_1996,labels=label,explode=[0,0],autopct='%3.1f%%',shadow=True,startangle=90)

             x array 用于绘制pie的参数

             explode  array 制定项离饼图圆心为n个半径

             labels   每一项的名称

             color  饼图颜色

             autopct   数值的显示方式

             pctdistance 每一项比例和距离饼图n个半径 默认为0.6  

             labeldistance   指定每一项的比例和距离饼图圆心n和半径

             radius  饼图半径,默认为1

     (3).箱线图

             箱线图也称箱须图,其绘制需使用常用统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征值的时候,更可表现其分散程度差异。

             matplotlib.pyplot.boxplot(x,notch=None,sym=None,

               vert=None,whis=None,positions=None,widths=None,

               patch_artist=None,meanline=None,labels=None,....)

            x 绘制箱线图的数据                positions 图形位置

            notch 箱体是否有缺口            widths  每个箱体的宽度

            sym 异常点形状                      labels  箱线图的标签 

            vert 图像纵向或横向               meanline 是否显示均值线

4.matplotlib保存图像

    matplotlib.pyplot.savefig()

    注意:要在pyplot.show()前使用,否则保存图片为空白

猜你喜欢

转载自blog.csdn.net/Kayaobi/article/details/83020454