/ SQL /パンダExcelの同じ列の出現の頻度と列の値を置換します

Ritvik女子:

私は600000以上のレコードとimplementer_useridという名前の列、複数のレコードごとに繰り返されるかもしれませんした値を含むテーブルを持っています。今私は、特定の個別の値はその列に発生している回数を格納します。私は特定の値のカウントをしたいし、代わりにそれらの周波数ですべての個別の値を置き換えていけないようCOUNTIF(エクセル)、GROUPBY(SQL)と同様の機能は、仕事を文句を言いません。:3つのフレームワークのいずれかにそうすることによって私を助けエクセル、パンダ(パイソン)&SQL

ここでは、画像の説明を入力します。

Alex312:

私が正しくあなたの問題を理解していれば、あなただけのvalue_counts()関数を用いて周波数テーブルを構築することができ、その後、あなたが以前に構築されてきた辞書から検索して、それぞれの周波数でのキー(行の値を)交換する、あなたのコラムを通過します。例えば:

frequencies = your_pandas_dataframe['Your column'].value_counts()
your_pandas_dataframe['Result column'] = your_pandas_dataframe['Your column'].apply(lambda x: frequencies[x])

あなたは、この余分な列を使用しない場合は、おそらく代わりに、このような何かを行うことができます。

# ...
your_pandas_dataframe['Your column'] = your_pandas_dataframe['Your column'].apply(lambda x: frequencies[x])

これは、あなたの質問にお答えしていますか?

おすすめ

転載: http://43.154.161.224:23101/article/api/json?id=13551&siteId=1