1、用途:pandas.cut函数
これは、離散的な間隔でデータセットの頻度統計を実行するために使用されます。
2.パラメータ:
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise')
x
:セグメント化されたクラス配列は1次元(DataFrameではない)である必要bins
があります。:ビンは間隔です。
right
:ブール型パラメーター。デフォルトはTrueで、間隔の正しい部分を含めるかどうかを示します。
labels
:セグメンテーション間隔のラベル。labels = Falseが指定されている場合、xのデータが返されるビンの数(0から開始)。retbins
:分割されたビンを返すかどうかを示すブール型パラメータ。デフォルトはFalseです。precision
:間隔の小数点以下の桁数を保持しますinclude_lowest
。デフォルトは3です。:boolパラメーター。間隔の左側が開いているか閉じているかを示し、デフォルトはfalseです。duplicates
:繰り返し間隔を許可するかどうか。2つのオプションがあります::raise
許可されない、:drop
許可される。
3.例:
acc_SVC_bin = pd.cut(acc_all['acc_SVC'],bins=[0, 0.5, 0.6, 0.7, 0.8,1],
include_lowest=True,right=False,
labels=['[0,50%)', '[50%,60%)', '[60%,70%)', '[70%,80%)', '[80%,100%]'])
print(pd.value_counts(acc_SVC_bin))
結果は次のとおりです。