ロック・リー:
私はこれらのプログラムのいずれかの種類の完全なニュービーです。
私は哲学と経済を学び、自分の投資戦略のためのWebクローラー用のPythonを学ぼう。
私は韓国から来たんだ、私はここに英語を入力するのは非常に緊張していますが、私は勇敢になろうとしています!(私の醜い英語を言い訳してください)
これは私がウェブサイトから持っていることをデータフレームです。
私は、金融件のデータをクロールすることだし、あなたが見るかもしれないとして、数字がそれにカンマを持っています。
自分のタイプがありますobject
。
私がやりたいことは、私はいくつかの数学を行うことができますので、それらの整数を作ることです。(合計、乗算、など)
私は(韓国のウェブサイトを含む)を検索し、私はこのコードのように、列名を使用して行う方法を見つけました
cols = ['col1', 'col2', ..., 'colN']
df[cols] = df[cols].replace({'\$': '', ',': ''}, regex=True)
しかし、私は必要なものは関係なく、カラムの名前を、それをやっています
私は2000以上の企業のデータと列の名前は会社によって異なります必要があります
私のようなコードをしたいのですが
"コル#端にCOLS、COL#0からcolsのでは '' 削除"
前もって感謝します
マニッシュChaudharyさん:
あなたが行うことができます非常に最初のものは、そのタイプによってデータフレームを区別し、それらが必要な処理を行うことです。
object_list = list(df.select_dtypes(include ="object"))
float_list = list(df.select_dtypes(include ="float64"))
int_list = list(df.select_dtypes(include ="int64"))
その後、何が必要置き換えます
df[object_list] = df[object_list].replace(",","")
df[float_list ] = df[float_list ].apply(str) # so that you can replace easily
df[float_list ] = df[float_list ].replace(",","")
df[float_list ] = df[float_list ].apply(float) # now its clean and int
df[int_list ] = df[int_list ].apply(str)
df[int_list ] = df[int_list ].replace(",","")
df[float_list ] = df[float_list ].apply(int)