パンダやPythonを使用して全体のデータフレーム内のカンマを削除する方法

ロック・リー:

私はこれらのプログラムのいずれかの種類の完全なニュービーです。

私は哲学と経済を学び、自分の投資戦略のためのWebクローラー用のPythonを学ぼう。

私は韓国から来たんだ、私はここに英語を入力するのは非常に緊張していますが、私は勇敢になろうとしています!(私の醜い英語を言い訳してください)

ここでは、画像の説明を入力します。

これは私がウェブサイトから持っていることをデータフレームです。

私は、金融件のデータをクロールすることだし、あなたが見るかもしれないとして、数字がそれにカンマを持っています。

自分のタイプがありますobject

私がやりたいことは、私はいくつかの数学を行うことができますので、それらの整数を作ることです。(合計、乗算、など)

私は(韓国のウェブサイトを含む)を検索し、私はこのコードのように、列名を使用して行う方法を見つけました

cols = ['col1', 'col2', ..., 'colN']

df[cols] = df[cols].replace({'\$': '', ',': ''}, regex=True)

しかし、私は必要なものは関係なく、カラムの名前を、それをやっています

私は2000以上の企業のデータと列の名前は会社によって異なります必要があります

私のようなコードをしたいのですが

"コル#端にCOLS、COL#0からcolsのでは '' 削除"

前もって感謝します

マニッシュChaudharyさん:

あなたが行うことができます非常に最初のものは、そのタイプによってデータフレームを区別し、それらが必要な処理を行うことです。

object_list = list(df.select_dtypes(include ="object"))
float_list = list(df.select_dtypes(include ="float64"))
int_list = list(df.select_dtypes(include ="int64"))

その後、何が必要置き換えます

df[object_list] = df[object_list].replace(",","")

df[float_list ] = df[float_list ].apply(str) # so that you can replace easily
df[float_list ] = df[float_list ].replace(",","")
df[float_list ] = df[float_list ].apply(float) # now its clean and int

df[int_list ] = df[int_list ].apply(str)
df[int_list ] = df[int_list ].replace(",","")
df[float_list ] = df[float_list ].apply(int)

おすすめ

転載: http://43.154.161.224:23101/article/api/json?id=320974&siteId=1