解决方法
如果已经读出来了这个问题,那么就只能使用replace
替换了:
import pandas as pd
def change_excel_char(value):
"""剔除读取excel中的 _x0000_ 字符"""
if type(value) == str:
return value.replace("_x0000_", '')
else:
return value
excel_data = pd.read_excel("xxxx.xlsx")
excel_data = excel_data.applymap(change_excel_char)
问题解析
这是因为pandas解析excel的.xlsx
文件时,使用的引擎是openpyxl,而有些情况下因为excel文件修修改改,导致有些编码格式被遗留在了excel单元格中,会在使用openpyxl时出现意外