1.はじめに
matplotlibのPythonは強力なグラフィックスとデータ可視化ツールキットです。データの可視化は、最終結果のデータ分析を完了し、多くの操作を完了するために、私たちを助けることができる私たちのデータ解析の最も重要な課題の一つであるインタラクティブなデータ可視化することです。
インストール:matplotlibのをインストールするPIP
参考方法:PLTとしてインポートmatplotlib.pyplot
2.plot関数(折れ線グラフ)
インポートnumpyのAS NP インポートPANDAS AS PD インポートASのPLTのmatplotlib.pyplot plt.rcParams [ ' font.sans serif- ' ] = [ ' SimHei ' ] #を加え、両者を参加ウィンドウシステムが、これらに限定されている解決する中国語 plt.rcParamsを【' axes.unicode_minus ' ] = Falseを X = [2,9,5,10 ] Y = [1,2,3,4 ] PLT。図(figsize =(10,6)) #のセットキャンバスサイズ plt.title (' タイトルのタイトル'、のfontSize = 20は、カラーである= ' 赤') #ヘッダサイズ及び色 plt.xlabel(' OK '、20のfontSize =) #1 設定値X plt.ylabel(' 列'、20のfontSize =) #集合Yの値 plt.plot(X、Y、マーカー = ' O '、をlineStyle = ' - ') #の図面、マーカーは、= 'O'は旋回点円で表示され #をlineStyleラインが表す点線 plt.show() #の表示画面
3.bar機能(ヒストグラム)
pd.read_csv = DF(' ./douban_movie.csv ') #内部のExcelに入ってくるデータ df.headを() #見る最初の5つのデータ RES = df.groupby(' 起源').size()。sort_values(昇順偽=) #'原点'映画部門に係る、ort_index()のインデックスは、()の値がインストールソートされ、インストール、sort_valuesソート RES X = res.index Y = res.values PLT。図(figsize)=(20,6) #セットキャンバスサイズ plt.title(' それぞれの国又は地域の映画に数'、のfontSize = 20) #1 タイトルのサイズと色 plt.xticks(回転= 90、のfontSize = 20、色= '赤') #回転= 90翻转90度 plt.xlabel(' 产地'フォントサイズは20 = ) plt.yticks(フォントサイズ = 20 ) (plt.ylabelを' 数量」、フォントサイズは= 20 ) ため、B にジッパー(X 、Y): plt.text(B +150、B、たHorizontalAlignment = ' 中央'、フォントサイズは15 = ) plt.bar(x、y)は (plt.show)を
4.pie関数(円グラフ)
df.head() df_res = df['时长'] df_res res = pd.cut(df_res,[0, 60, 90, 120,140,1000]) # df_res是待分割的源数据 [0, 60, 90, 120,140,1000] 是区间,左开右闭 res res = res.value_counts() res x = res.index y = res.values plt.title('电影时长分布图',fontsize=20) patch, l_text, p_text = plt.pie(y, labels = x, autopct='%.2f%%') for p in p_text: p.set_size(12) p.set_color('white') for l in l_text: p.set_size(13) p.set_color('red') plt.pie(y) plt.show()
5、保存图表到文件
常用格式:plt.savafig('文件名.拓展名')
文件类型是通过文件扩展名推断出来的。因此,如果你使用的是.pdf,就会得到一个PDF文件。
plt.savefig('123.pdf')
savefig并非一定要写入磁盘,也可以写入任何文件型的对象,比如BytesIO:
from io import BytesIO buffer = BytesIO() plt.savefig(buffer) plot_data = buffer.getvalue()
参数 | 说明 |
fname | 含有文件路径的字符串或者Python的文件型对象。 |
dpi | 图像分辨率,默认为100 |
format | 显示设置文件格式("png","jpg","pdf","svg","ps",...) |
facecolor | 背景色,默认为"W"(白色) |
bbox_inches | 图表需要保存的部分。设置为”tight“,则尝试剪除图表周围空白部分 |