第二章 数据的图表展示1 - matplotlib库

数据的图表展示 - matplotlib库的使用

#中文展现
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 绘制折线图 - 
#图形设置参数 - 图例,图像大小,绘制网格线,绘制参考线,绘制参考区域
plt.figure(figsize=(12,8),dpi=100,facecolor='white')             #布置画布大小,分辨率,画布边框颜色
fig1 = get_sample(df=ttnkh, sampling="simple_random", k=10).sort_values(by='Age')
plt.plot(fig1['Age'],fig1['Fare'],c='red',marker='o',markersize=4,markeredgecolor='blue',lw=2.6,ls='--',label='年龄与船票价格')    #数据点的形状,颜色,大小,线条的粗细和线形,颜色
plt.legend(loc='best',fontsize=10,frameon=True)    #图例:位置,字体大小,是否有边框
#plt.grid(ls='--',c='red')                           #网格线:线型和颜色
#plt.axhline(y=10,c='blue',ls='--')                  #绘制平行于x轴参考线
#plt.axvline(x=12,c='green')                         #绘制平行于y轴参考线
#plt.axvspan(xmin=10,xmax=20,facecolor='red')         #绘制平行于y轴的参考区域
#plt.axhspan(ymin=10,ymax=20,facecolor='red')        #绘制平行于x轴的参考区域
​
plt.title('年龄与票价的关系展示')                   
plt.xlabel('年龄')                 
plt.ylabel('票价')                 
plt.xticks([0,10,20,30,40,50,60,70])
plt.yticks([0,5,10,15,20,25,30,35,40,45,50])
plt.xlim([0,50])
plt.ylim([0,70])
plt.savefig('D:\jupyter_notebook\save\plt1.pdf')           #图形保存
plt.show()
使用简单随机抽样

绘制 - 饼图,条形图,直方图,
简单图形绘制 - 饼图,条形图,直方图,
# 饼图 - 分类数据结构化展示
data_pie = result1.groupby('Pclass').count()['Fare']                
data_pie_data = data_pie.values
data_pie_index = data_pie.index
plt.figure(figsize=(8,8),dpi=100,facecolor='white')
#设置饼图:半径,百分比,百分比显示距离圆心半径,标签,标签距离圆心位置,突出显示,边框的线宽和颜色,文本的颜色和大小
plt.pie(x=data_pie_data,radius=1.5,autopct='%.2f%%',pctdistance=0.6,labels=data_pie_index,labeldistance=1.1,
        explode=[0.1,0.1,0.1],wedgeprops ={'linewidth':1.5,'edgecolor':'green'},textprops={'fontsize':10,'color':'blue'})
plt.title('船舱等级人数占比',pad=80)              #设置标题及距离坐标轴的位置
plt.show()

#图形设置参数 - 图例,图像大小,绘制网格线,绘制参考线,绘制参考区域
#图形设置参数 - 图例,图像大小,绘制网格线,绘制参考线,绘制参考区域
字体大小和距离坐标轴的距离
#条形图 - 分类数据的频率展示
#条形图:x轴上数值,y轴上数值(分类数据的频率),x轴上的标签(分类标签),条形图填充颜色,
plt.bar(x=range(0,len(data_pie_data)),height= data_pie_data,tick_label=data_pie_index,color = 'y')
plt.xlabel('Pclass',labelpad=20,fontsize=20)    #控制x标签字体大小和距离坐标轴的距离
plt.ylabel('Num',labelpad=20)
plt.show()

True
#直方图 - 数值型数据展示 
#直方图:数据,分组个数,条形图颜色,条形图边框颜色,是否以频率展示出来
plt.hist(x=result1['Fare'],bins=20,color='r',edgecolor='black',density=True)
plt.show()

#散点图 - 展示两个连续性变量之间的关系
#散点图:x轴数据,y轴数据,点的形状,大小,颜色
plt.scatter(x = fig1['Age'],y=fig1['Fare'],marker='*',s=10,c='r')
plt.show()

#气泡图 - 描述三个变量之间的关系,为散点图的延伸
s1 = np.arange(1,100,10)
print(s1)
plt.scatter(x = fig1['Age'],y=fig1['Fare'],marker='o',s=s1,c='r')
[ 1 11 21 31 41 51 61 71 81 91]
<matplotlib.collections.PathCollection at 0x1d3f0ba7be0>

发布了5 篇原创文章 · 获赞 0 · 访问量 36

猜你喜欢

转载自blog.csdn.net/qq_27924553/article/details/105106271
今日推荐