在Python中经常使用pandas来处理表格文件:
import pandas as pd
f=open("学生体测成绩表.csv",encoding='utf-8')
myfile=pd.read_csv(f) //文件名中含有中文字符是不能直接作为read_csv的参数的
如果报错CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2 ,则一般是文件的格式出现问题,文件格式需要是后缀为.csv,但不要强制重命名改后缀会损坏文件,选择另存为重新保存格式为csv。
此外还有报错信息UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 11126: illegal multibyte sequence
说明文本的解码出现了问题,文本中出现了‘gbk’无法解码的特殊符号,可以换用解码范围更广的‘gb18030’或'utf-8'