数据分析中相关性分析

python里面可以通过第三方库实现,也可以自己写。
法1
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv(“pollution2.csv”)
cov = np.corrcoef(data.T)
img = plt.matshow(cov,cmap=plt.cm.winter)
plt.colorbar(img, ticks=[-1,0,1])
plt.xticks(np.arange(len(data.keys())), data.keys())
plt.yticks(np.arange(len(data.keys())), data.keys())
plt.show()
法2
import pandas_profiling
import pandas as pd
data = pd.read_csv(“pollution2.csv”)
profile = pandas_profiling.ProfileReport(data)
profile.to_file(‘dataset.html’)

发布了21 篇原创文章 · 获赞 8 · 访问量 3099

猜你喜欢

转载自blog.csdn.net/weixin_42497252/article/details/103226605