Estoy completa Newby a cualquier tipo de estos programas.
Estudié filosofía y economía y tratando de aprender Python para rastreador web para mi propia estrategia de inversión.
Soy de Corea del Sur, así que estoy bastante nervioso para escribir Inglés aquí, pero yo estoy tratando de ser valiente! (Por favor, disculpe mi fea Inglés)
introducir descripción de la imagen aquí
esta es la trama de datos que tengo desde el sitio web.
Me estoy arrastrando Datas financieros y como se puede ver, los números tiene comas en ella.
sus tipos son object
.
lo que yo quiero hacer es hacerlos número entero por lo que puedo hacer algunos cálculos. (suma, multiplicación, etc.)
Busqué (incluyendo sitios web de Corea) y he encontrado la manera de hacerlo utilizando el nombre de las columnas, al igual que el código
cols = ['col1', 'col2', ..., 'colN']
df[cols] = df[cols].replace({'\$': '', ',': ''}, regex=True)
Pero, lo que necesito lo está haciendo sin nombre columnas
I Need de datos y columnas de más de 2000 empresas nombres son diferentes dependiendo de la empresa
Me gustaría hacer un código como
"Borrar '' en cols, cols de col # 0 a # fin col"
Gracias por adelantado
la primera cosa que puede hacer es que la trama de datos diferencian por su tipo y hacer el procesamiento que necesitaban.
object_list = list(df.select_dtypes(include ="object"))
float_list = list(df.select_dtypes(include ="float64"))
int_list = list(df.select_dtypes(include ="int64"))
luego reemplace lo que sea necesario
df[object_list] = df[object_list].replace(",","")
df[float_list ] = df[float_list ].apply(str) # so that you can replace easily
df[float_list ] = df[float_list ].replace(",","")
df[float_list ] = df[float_list ].apply(float) # now its clean and int
df[int_list ] = df[int_list ].apply(str)
df[int_list ] = df[int_list ].replace(",","")
df[float_list ] = df[float_list ].apply(int)