록 리 :
나는이 프로그램의 모든 종류의 완전한 뉴비입니다.
나는 철학, 경제와 내 자신의 투자 전략을위한 웹 크롤러를위한 파이썬을 배우려고 노력을 공부했다.
나는 한국에서, 그래서 내가 여기에 영어를 입력하는 것은 매우 불안 해요,하지만 난 용감하려고 해요! (내 추한 영어를 용서하시기 바랍니다)
이것은 내가 웹 사이트에서 가지고있는 DataFrame입니다.
나는 금융 datas를 크롤링하고있어 당신이 볼 수있는 바와 같이, 숫자는 쉼표있다.
자신의 유형은 object
.
내가 뭘 원하는 내가 약간의 수학을 할 수 있도록 정수를 확인하는 것입니다. (합계, 곱셈 등)
나는 (한국어 웹 사이트 포함)를 검색하고이 코드처럼 열 이름을 사용 할 수있는 방법을 발견
cols = ['col1', 'col2', ..., 'colN']
df[cols] = df[cols].replace({'\$': '', ',': ''}, regex=True)
그러나, 내가 필요한 관계없이 열 '이름을하고있다
나는 이상 2,000 기업의 데이터와 컬럼의 이름은 회사에 따라 다릅니다 필요
내가 좋아하는 코드를하고 싶습니다
"COL #에서 COLS 0 COL 번호의 끝, COLS에 ','삭제"
미리 감사드립니다
마니 Chaudhary :
당신이 할 수있는 첫 번째 일은 자신의 유형별로 차별화 데이터 프레임과 그들이 필요한 처리를 수행.
object_list = list(df.select_dtypes(include ="object"))
float_list = list(df.select_dtypes(include ="float64"))
int_list = list(df.select_dtypes(include ="int64"))
당신이 필요로하는 무엇이든 교체
df[object_list] = df[object_list].replace(",","")
df[float_list ] = df[float_list ].apply(str) # so that you can replace easily
df[float_list ] = df[float_list ].replace(",","")
df[float_list ] = df[float_list ].apply(float) # now its clean and int
df[int_list ] = df[int_list ].apply(str)
df[int_list ] = df[int_list ].replace(",","")
df[float_list ] = df[float_list ].apply(int)