Matplotlibの一般的なグラフ描画
Matplotlibは、折れ線グラフ、散布図、ヒストグラム、ヒストグラム、および円グラフを描画できます。
データを表示するために選択する統計グラフを決定するには、さまざまな統計グラフの意味を知る必要があります。
1一般的なグラフィックの種類と意味
-
折れ線グラフ:折れ線の上昇または下降による統計量の増減を示す統計チャート
特徴:データの変化する傾向を表示し、物事の変化する状況を反映することができます。(変更点)【変更点】
api:plt.plot(x、y)
-
散布図: 2セットのデータを使用して、複数の座標点を形成し、座標点の分布を調べ、2つの変数間に特定の相関関係があるかどうかを判断し、座標点の分布パターンを要約します。
特徴:変数間に定量的な相関傾向があるかどうかを判断し、外れ値を表示します(分布法) [分布法]
api:plt.scatter(x、y)
-
ヒストグラム:ワークシートの列または行に配置されたデータをヒストグラムに描画できます。
特徴:離散データを描画し、各データのサイズを一目で確認し、データ間の違いを比較できます。(統計/比較) [統計/比較]
api:plt.bar(x、width、align = 'center'、** kwargs) [xは次元の値を表します]
-
Parameters: x : 需要传递的数据 width : 柱状图的宽度 align : 每个柱状图的位置对齐方式 {‘center’, ‘edge’}, optional, default: ‘center’ **kwargs : color:选择柱状图的颜色
-
ヒストグラム:高さの異なる一連の縦縞または線分がデータ分布を表します。通常、横軸はデータ範囲を表し、縦軸は分布を表します。
特徴:連続データを描画して、1つ以上のデータセットの分布を示します(統計) [正規分布]
api:matplotlib.pyplot.hist(x、bins = None)
Parameters: x : 需要传递的数据 bins : 组距
-
円グラフ:さまざまなカテゴリの比率を示し、さまざまなカテゴリを円弧サイズで比較するために使用されます。
特徴:分類されたデータの割合(割合) [割合]
api:plt.pie(x、labels =、autopct =、colors)
Parameters: x:数量,自动算百分比 labels:每部分名称 autopct:占比显示指定%1.2f%% colors:每部分颜色
2散布図の描画
需要:住宅面積と住宅価格の関係を探る
住宅面積データ:
x = [225.98, 247.07, 253.14, 457.85, 241.58, 301.01, 20.67, 288.64,
163.56, 120.06, 207.83, 342.75, 147.9 , 53.06, 224.72, 29.51,
21.61, 483.21, 245.25, 399.25, 343.35]
住宅価格データ:
y = [196.63, 203.88, 210.75, 372.74, 202.41, 247.61, 24.9 , 239.34,
140.32, 104.15, 176.84, 288.23, 128.79, 49.64, 191.74, 33.1 ,
30.74, 400.02, 205.35, 330.64, 283.45]
サンプルコード:
# 0.准备数据
x = [225.98, 247.07, 253.14, 457.85, 241.58, 301.01, 20.67, 288.64,
163.56, 120.06, 207.83, 342.75, 147.9 , 53.06, 224.72, 29.51,
21.61, 483.21, 245.25, 399.25, 343.35]
y = [196.63, 203.88, 210.75, 372.74, 202.41, 247.61, 24.9 , 239.34,
140.32, 104.15, 176.84, 288.23, 128.79, 49.64, 191.74, 33.1 ,
30.74, 400.02, 205.35, 330.64, 283.45]
# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)
# 2.绘制散点图
plt.scatter(x, y)
# 3.显示图像
plt.show()
3ヒストグラムの描画
需要-各映画の興行収入を比較します
映画のデータを次の図に示します。
- データを準備する
['雷神3:诸神黄昏','正义联盟','东方快车谋杀案','寻梦环游记','全球风暴', '降魔传','追捕','七十七天','密战','狂兽','其它']
[73853,57767,22354,15969,14839,8725,8716,8318,7916,6764,52222]
- ヒストグラムを描く
サンプルコード:
# 0.准备数据
# 电影名字
movie_name = ['雷神3:诸神黄昏','正义联盟','东方快车谋杀案','寻梦环游记','全球风暴','降魔传','追捕','七十七天','密战','狂兽','其它']
# 横坐标
x = range(len(movie_name))
# 票房数据
y = [73853,57767,22354,15969,14839,8725,8716,8318,7916,6764,52222]
# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)
# 2.绘制柱状图
plt.bar(x, y, width=0.5, color=['b','r','g','y','c','m','y','k','c','g','b'])
# 2.1b修改x轴的刻度显示
plt.xticks(x, movie_name)
# 2.2 添加网格显示
plt.grid(linestyle="--", alpha=0.5)
# 2.3 添加标题
plt.title("电影票房收入对比")
# 3.显示图像
plt.show()
参照リンク:
https://matplotlib.org/index.html
4まとめ
- 折れ線グラフ
- データの変化する傾向を示し、物事の変化する状況を反映することができます。(バラエティ)
- plt.plot()
- 散布図
- 変数間に定量的な相関傾向があるかどうかを判断し、外れ値を表示します(分布法則)
- plt.scatter()
- ヒストグラム
- 離散データをプロットすると、各データのサイズが一目でわかり、データ間の違いを比較できます。(統計/比較)
- plt.bar(x、width、align = "center")
- ヒストグラム
- 連続データをプロットして、1つ以上のデータセットの分布を示します(統計)
- plt.hist(x、bins)
- 円グラフ
- さまざまなカテゴリの比率を示し、ラジアンのサイズでさまざまなカテゴリを比較するために使用されます
- plt.pie(x、labels、autopct、colors)