Breve descripción de los requisitos: una gran cantidad de archivos .xlsx se descargan en la computadora, y el .xlsx debe fusionarse en un solo .xlsx. Es demasiado lento y propenso a errores fusionarse manualmente.
Problemas actuales:
1. xlsx está almacenado en la misma carpeta, pero hay otros tipos de archivos en la carpeta, como .txt y pdf, y el requisito es combinar solo archivos xlsx.
2. Cada encabezado xlsx puede ser inconsistente
import xlrd
import pandas as pd
import os
'
`` pitón
Especifique la dirección donde se almacena el archivo, es decir, el archivo en el que se leerá la carpeta, esta es una ruta absoluta
dir_str = r'D: \ Mijia business \ calentador \ encuesta de demanda de la plataforma de comercio electrónico \ Evaluación del producto JD '
```python
## 获取指定文件夹下所有csv文件名称并传送给file_name_list,用一个list去装所有的文件
file_name_list=os.listdir(dir_str)
## 遍历出该文件夹下的所有csv格式的文件,使用for循环
file_dir_list=[os.path.join(dir_str,x) for x in file_name_list]
print(file_dir_list) ### 全部去读取到了
### 定义DataFrame类型的变量df用来存放获取的所有数据
df=pd.DataFrame()
## for 循环遍历读取每个xlsx里面的数据
for i in file_name_list:
if(i[-9:]=='好中差评.xlsx'): ## 筛选只读取xlsx结尾的文件,list的切片方法
EXCEL1=pd.read_excel(file_dir_list[i])
# concat 方法合并多个文件的数据
df=pd.concat(df,EXCEL1)
Hubo un error en el resultado de la operación.
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-82-1d65c5381c60> in <module>
2 for i in file_name_list:
3 if(i[-9:]=='好中差评.xlsx'): ## 筛选只读取xlsx结尾的文件,list的切片方法
----> 4 EXCEL1=pd.read_excel(file_dir_list[i])
5 # concat 方法合并多个文件的数据
6 df=pd.concat(df,EXCEL1)
TypeError: list indices must be integers or slices, not st