パンダカット()関数

序文:

pandas では、`cut()` 関数を使用して、連続する数値データを指定された間隔に従って離散的な間隔に分割します。一連の値を異なる間隔に分割し、対応する間隔ラベルを各値に割り当てることができます。`cut()` 関数の使用法は次のとおりです。

pandas.cut(x, bins, labels=None, right=True, include_lowest=False, precision=3)

パラメータの説明:
- `x`: 分割する数値データ。DataFrame 列、シリーズ、または配列にすることができます。
- `bins`: 分割された区間の境界を指定します。分割された間隔の数を表す整数にすることも、カスタム間隔の境界を表す配列にすることもできます。
- `labels`: オプションのパラメータ。各間隔のラベルを指定するために使用されます。
- `right`: オプションのパラメータ。右側に区間境界を含めるかどうかを指定します。デフォルトは True で、右閉区間を示します。
- `include_lowest`: オプションのパラメータで、最低境界が間隔に含まれるかどうかを指定します。デフォルトは False で、最低境界が含まれないことを意味します。
- `precision`: ラベルの小数点以下の桁数を指定するオプションのパラメータ。

例:

import pandas as pd

# 创建一个示例DataFrame
data = {'Age': [25, 30, 35, 40, 45]}
df = pd.DataFrame(data)

# 使用cut()函数划分年龄区间,并指定标签
df['AgeGroup'] = pd.cut(df['Age'], bins=[0, 30, 40, 50], labels=['<30', '30-40', '40+'])

print(df)
```

输出结果:
```
   Age AgeGroup
0   25      <30
1   30    30-40
2   35    30-40
3   40      40+
4   45      40+

上の例では、「cut()」関数を使用して、年齢データを「<30」、「30-40」、「40+」の 3 つの区間に分割します。分割された

おすすめ

転載: blog.csdn.net/m0_69097184/article/details/131905363