棒グラフ
あなたは変数の分布ヒストグラムの値を見ることができた場合は、棒グラフは、私たちは機能のカテゴリを見るのを助けることができます。棒グラフで、型幅を示す細長い周波数カテゴリの長さを示します。
matplotlibのでは、我々は、パラメータxは配列のx軸位置を表しplt.bar(X、高さ)関数を使用し、高さがy軸の数値配列、カラムの即ち高さです。
Seabornでは、我々はsns.barplot(使用X =なし、Y =なし、データ=なし)機能を。パラメータは、データ型データフレーム、Xであり、yは変数データです。
1 |
X = [ "CAT1"、 "CAT2"、 "CAT3"、 "CAT4"、 "CAT5"] |
我々は、周波数カテゴリおよびカテゴリを表すX、Y二つの配列を作成し、その後、matplotlibのとSeabornとバーグラフを表示し、次のように、結果は次のとおりです。
箱ひげ図
最大値(MAX)、最小値(MIN)、中央値(メジアン)と上下四分位数(:ボックスプロットとして知られるボックスプロットは、それは5つのデータ点によって1977年に提案されましたQ3、Q1)。それは、私たちはこのような分散や外れ値度として、データの差異を分析することができます。
ラベルはデフォルトでmatplotlibのでは、我々はxは描画データの箱ひげ図のパラメータであるplt.boxplot(X、ラベル=なし)機能を使用し、ラベルは、ボックスプロットとして添加してもよいです。
在Seaborn中,我们使用sns.boxplot(x=None, y=None, data=None)函数。其中参数data为DataFrame类型,x、y是data中的变量。
1 |
data = np.random.normal(size=(10,4)) |
这段代码中,我生成0-1之间的10*4维度数据,然后分别用Matplotlib和Seaborn进行箱线图的展示,结果如下。
饼图
饼图是常用的统计学模块,可以显示每个部分大小与总和之间的比例。在Python数据可视化中,它用的不算多。我们主要采用Matplotlib的pie函数实现它。
在Matplotlib中,我们使用plt.pie(x, labels=None)函数,其中参数x代表要绘制饼图的数据,labels是缺省值,可以为饼图添加标签。
这里我设置了lables数组,分别代表高中、本科、硕士、博士和其他几种学历的分类标签。nums代表这些学历对应的人数。
1 |
nums = [25,37,33,37,6] |
通过Matplotlib的pie函数,我们可以得出下面的饼图:
热力图
热力图,英文叫heat map,是一种矩阵表示方法,其中矩阵中的元素值用颜色来代表,不同的颜色代表不同大小的值。通过颜色就能直观地知道某个位置上数值的大小。另外你也可以将这个位置上的颜色,与数据集中的其他位置颜色进行比较。
热力图是一种非常直观的多元变量分析方法。
我们一般使用Seaborn中的sns.heatmap(data)函数,其中data代表需要绘制的热力图数据。
这里我们使用Seaborn中自带的数据集flights,该数据集记录了1949年到1960年期间,每个月的航班乘客的数量。
1 |
flights = sns.load_dataset("flights") |
通过seaborn的heatmap函数,我们可以观察到不同年份,不同月份的乘客数量变化情况,其中颜色越浅的代表乘客数量越多,如下图所示:
蜘蛛图
蜘蛛图是一种显示一对多关系的方法。在蜘蛛图中,一个变量相对于另一个变量的显著性是清晰可见的。
假设我们想要给王者荣耀的玩家做一个战力图,指标一共包括推进、KDA、生存、团战、发育和输出。那该如何做呢?
这里我们需要使用Matplotlib来进行画图,首先设置两个数组:labels和stats。他们分别保存了这些属性的名称和属性值。
因为蜘蛛图是一个圆形,你需要计算每个坐标的角度,然后对这些数值进行设置。当画完最后一个点后,需要与第一个点进行连线。
因为需要计算角度,所以我们要准备angles数组;又因为需要设定统计结果的数值,所以我们要设定stats数组。并且需要在原有angles和stats数组上增加一位,也就是添加数组的第一个元素。
1 |
labels=np.array([u"推进","KDA",u"生存",u"团战",u"发育",u"输出"]) |
コードflt.figureは塗装前に白紙の状態と同等のものを準備することを目指し、空白の図のターゲットを作成することです。次いでadd_subplot(111)は、アートボード1行に分割することができます。次いでax.plotとax.fillグラフィック及び色に配線します。最後に、我々は適切な位置に属性名を表示します。
オリジナル:大列 Pythonのデータの可視化を用いて(2)