2020-10-19:pandas.cut関数を使用して頻度を間隔でカウントします

1、用途:pandas.cut函数これは、離散的な間隔でデータセットの頻度統計を実行するために使用されます。

2.パラメータ:

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise') 

x:セグメント化されたクラス配列は1次元(DataFrameではない)である必要
binsがあります。:ビンは間隔です。

right:ブール型パラメーター。デフォルトはTrueで、間隔の正しい部分を含めるかどうかを示します。

labels:セグメンテーション間隔のラベル。labels = Falseが指定されている場合、xのデータが返されるビンの数(0から開始)。
retbins:分割されたビンを返すかどうかを示すブール型パラメータ。デフォルトはFalseです。
precision:間隔の小数点以下の桁数を保持します
include_lowestデフォルトは3です。:boolパラメーター。間隔の左側が開いているか閉じているかを示し、デフォルトはfalseです。
duplicates:繰り返し間隔を許可するかどうか。2つのオプションがあります::raise許可されない、:drop許可される。

 

3.例:

acc_SVC_bin = pd.cut(acc_all['acc_SVC'],bins=[0, 0.5, 0.6, 0.7, 0.8,1],
                     include_lowest=True,right=False, 
                    labels=['[0,50%)', '[50%,60%)', '[60%,70%)', '[70%,80%)', '[80%,100%]'])
print(pd.value_counts(acc_SVC_bin))

結果は次のとおりです。

 

おすすめ

転載: blog.csdn.net/weixin_38192254/article/details/109163849