pandas中绘图函数

1.线形图

import matplotlib.pyplot as plt

s = Series(np.random.randint(0,20,size=10))

#bins默认值是10,值越大,条越细

s.hist(bins=100)

简单的DataFrame图标实例.plot

df = DataFrame(np.random.randint(0,150,size=(5,4)),

    columns=['python','java','math','chinese'])

df.plot()

2.柱状图

DataFrame柱状图

#在plot中定义类型为柱状图

df.plot(kind='bar')

#显示为横向柱状图

df.plot(kind='barsh')

读取tips.csv文件

tip = pd.read_csv('./data/tips.csv')

tip.set_index('day',inplace=True)

#将不重要的数据去除掉

tip.drop(axis=1,labels=['1','6'],inplace=True)

tip.iloc[:,1:-1].plot(kind='bar')

3.直方图

random生成随机直方图,调用hist()方法

#bins默认值是10,值越大,条越细
s.hist(bins=100)

np.random.normal()正态分布函数

np.random.normal(loc=15,scale=5,size=1000)
#将nd1和nd2连接起来
nd3 = np.concatenate([nd1,nd2])

nd3
#normal统一的,将数据归一化,解决密度线趴下的问题
s.hist(bins=70,normed=True)

4.散布图

是观察两个一维数据列之间的关系的有效方法

df['C++'] = df['python'].map(lambda x:0.7 * x + 20)

df

scatter需要x和y两个参数,它的作用是进行对比

df.plot(kind='scatter',x='python',y='java')

函数pd.plotting.scatter_matrix(),diagnol:对角线

#散点图可以让我们扎到两列数据之间的关系
#1.如果数据量太小两列数据没有关系,加大数据量,又会形成关系
#2.并不是说数据量越大,两列之间的关系会越明显,在数据过大的情况,关系会发生改变
pd.plotting.scatter_matrix(df,figsize=(12,9),diagonal='kde')

猜你喜欢

转载自blog.csdn.net/u014229742/article/details/80752209