Pythonデータ分析実戦 - データフレームの列を重複排除し、重複排除後の数をカウントする(ソースコードと実装効果あり)

実現機能

データフレームの特定の列の重複排除された値と数量

1. データフレームの特定の列の重複排除値

df[""].unique()

2. データフレームの列内の重複排除された値の数

len(df[""].unique())

実装コード

import pandas as pd

data = pd.DataFrame({'name':['wencky','stany','barbio'],
                      'age':[29,29,3],
                      'gender':['w','m','m']})

print(data)
print('age去重',data["age"].unique(),sep='\n')
print('去重后数量',len(data["age"].unique()),sep='\n')

効果を達成する

 大学院在学中に、SCI データマイニングに関連する 5 つの論文を発表しました。現在、研究機関がデータマイニングに関連する科学研究に取り組んでいます。データマイニングについては一定の知識と理解を持っています。私自身の科学研究の実践経験を組み合わせて、 Pythonの機械学習やディープラーニングについて随時シェア、データマイニングの基礎知識と事例。

オリジナルであること、最もシンプルな方法で理解して学習することのみを重視しており、V サブスクリプション番号に注意してください: データその他のフォーラム、スキルやソース コードの詳細については私に連絡してください。

おすすめ

転載: blog.csdn.net/sinat_41858359/article/details/131084267