パンダデータはduplicate()とdrop_duplicates()を繰り返し処理します


✌duplicate()和drop_duplicates()

✌ガイドライブラリ

import pandas as pd
import numpy as np

✌データセットを作成する

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

ここに画像の説明を挿入します

✌重複()

データの各行が繰り返されるかどうかを返します

x.duplicated()

ここに画像の説明を挿入します

✌繰り返しデータの数を計算する

x.duplicated().sum()

ここに画像の説明を挿入します

✌drop_duplicates()

重複する値を削除する

x=x.drop_duplicates()
x

ここに画像の説明を挿入します

おすすめ

転載: blog.csdn.net/m0_47256162/article/details/113789388