数据分析与挖掘之数据可视化(python)

#绘制折线图/散点图plot
import matplotlib.pylab as  pyl  #导入可视化模块
import numpy as npy  #导入数组模块
pyl.rcParams['font.sans-serif']=['SimHei']  # 用来正常显示中文标签  
pyl.rcParams['axes.unicode_minus']=False  # 用来正常显示负号
x=[1,2,3,4,8]
y=[5,7,2,1,5]
#pyl.plot(x,y)  #plot(x轴,y轴,展现形式)  默认折线图
#pyl.show() 
#pyl.plot(x,y,'o')   #散点图
#pyl.show()  
#pyl.plot(x,y,'oc')  #青色的散点图
#pyl.show()
'''
c  青色、r  红色、m  品红、g  绿色、b  蓝色、y  黄色、k  黑色、w  白色
'''
#如果图层未取消则重叠展现
#线条样式
#pyl.plot(x,y,'--oc') #青色散点虚线
#pyl.show()
'''
- 直线
--  虚线
-.   -.的形式
:  细小的虚线
'''
#点的样式(默认散点图)
#pyl.plot(x,y,'*') #星形散点
#pyl.show()
'''
s  方形
h /H  六角形
*   星行
+  加号
x  x型
d/D  棱形
p  五角形
'''
pyl.plot(x,y) #初始x,y
x2=[1,3,5,6,8,10,12,19]
y2=[1,6,9,10,12,19,23,25]
pyl.plot(x2,y2,'oc')
pyl.plot(x,y,'*r')
pyl.title("趋势图")  #表名
pyl.xlabel("年龄")  #横轴名称
pyl.ylabel("脾气")  #纵轴名称
pyl.xlim(0,20)  #x轴范围
pyl.ylim(1,40)  #y轴范围
pyl.show()
#随机数的生成
data=npy.random.random_integers(1,20,10)#(min,max,个数)
print(data)
#生成具有正太分布的随机数
data2=npy.random.normal(5.0,2.0,10)#(均值,西格玛(标准差),个数)
print(data2)
#更多随机数生成知识:http://www.mamicode.com/info-detail-507676.html


#直方图hist
data3=npy.random.normal(10.0,1.0,10000)
#pyl.hist(data3)
#pyl.show()
data4=npy.random.random_integers(1,25,1000) #(min,max,个数)
#pyl.hist(data4)
sty=npy.arange(2,25,2)  #(min,max,步长)设置直方图宽度、上下限
pyl.hist(data4,sty,histtype='stepfilled')  #取消轮廓:histtype='stepfilled'  
pyl.show()



#绘制子图
pyl.subplot(2,2,1) #(2行,2列,当前区域1)
x1=[1,2,3,4,5]
y1=[5,3,5,7,9]
pyl.title("111")
pyl.plot(x1,y1,'c')
pyl.subplot(2,2,2) #(2行,2列,当前区域2)
x1=[6,2,13,4,15]
y1=[15,13,35,7,9]
pyl.title("222")
pyl.plot(x1,y1,'r')
pyl.subplot(2,1,2) #(2行,1列,当前区域2)
x1=[11,21,31,4,5]
y1=[15,31,5,7,19]
pyl.title("333")
pyl.plot(x1,y1,'*')
pyl.show()


#读取csv格式的数据并可视化分析
import pandas as pda
import numpy as npy
import matplotlib.pylab as pyl
pyl.rcParams['font.sans-serif']=['SimHei']  # 用来正常显示中文标签  
pyl.rcParams['axes.unicode_minus']=False  # 用来正常显示负号
data=pda.read_csv("E:\python数据分析与挖掘\源码\源码\第5周\hexun.csv")
data.shape  #行、列信息
data.values[1][2]  #[行][列]  第二行第三列
data2=data.T #转置
x1=data2.values[3]  #评论数
y1=data2.values[4]  #阅读量
pyl.plot(x1,y1,'.')
pyl.title("阅读与点击量")
pyl.xlabel("评论数")
pyl.ylabel("阅读量")
pyl.show()

#文章ID和阅读数的集中趋势
x2=data2.values[0]
pyl.plot(x2,y1)
pyl.show()
pyl.title("阅读与ID")
pyl.xlabel("ID")
pyl.ylabel("阅读量")
pyl.show()












猜你喜欢

转载自blog.csdn.net/weixin_42219287/article/details/82748574