팬더 또는 파이썬을 사용하여 전체 DataFrame에 쉼표를 삭제하는 방법

록 리 :

나는이 프로그램의 모든 종류의 완전한 뉴비입니다.

나는 철학, 경제와 내 자신의 투자 전략을위한 웹 크롤러를위한 파이썬을 배우려고 노력을 공부했다.

나는 한국에서, 그래서 내가 여기에 영어를 입력하는 것은 매우 불안 해요,하지만 난 용감하려고 해요! (내 추한 영어를 용서하시기 바랍니다)

여기에 이미지 설명을 입력

이것은 내가 웹 사이트에서 가지고있는 DataFrame입니다.

나는 금융 datas를 크롤링하고있어 당신이 볼 수있는 바와 같이, 숫자는 쉼표있다.

자신의 유형은 object.

내가 뭘 원하는 내가 약간의 수학을 할 수 있도록 정수를 확인하는 것입니다. (합계, 곱셈 등)

나는 (한국어 웹 사이트 포함)를 검색하고이 코드처럼 열 이름을 사용 할 수있는 방법을 발견

cols = ['col1', 'col2', ..., 'colN']

df[cols] = df[cols].replace({'\$': '', ',': ''}, regex=True)

그러나, 내가 필요한 관계없이 열 '이름을하고있다

나는 이상 2,000 기업의 데이터와 컬럼의 이름은 회사에 따라 다릅니다 필요

내가 좋아하는 코드를하고 싶습니다

"COL #에서 COLS 0 COL 번호의 끝, COLS에 ','삭제"

미리 감사드립니다

마니 Chaudhary :

당신이 할 수있는 첫 번째 일은 자신의 유형별로 차별화 데이터 프레임과 그들이 필요한 처리를 수행.

object_list = list(df.select_dtypes(include ="object"))
float_list = list(df.select_dtypes(include ="float64"))
int_list = list(df.select_dtypes(include ="int64"))

당신이 필요로하는 무엇이든 교체

df[object_list] = df[object_list].replace(",","")

df[float_list ] = df[float_list ].apply(str) # so that you can replace easily
df[float_list ] = df[float_list ].replace(",","")
df[float_list ] = df[float_list ].apply(float) # now its clean and int

df[int_list ] = df[int_list ].apply(str)
df[int_list ] = df[int_list ].replace(",","")
df[float_list ] = df[float_list ].apply(int)

추천

출처http://43.154.161.224:23101/article/api/json?id=320972&siteId=1