导入CSV文件的各种问题汇总

直接用python读取(不建议),各种转码乱码问题,如果要作图还是要放到DataFrame或者array中,何必呢!工具的使用我们还是坚持【不求甚解好用至上】,【人能避免的不要给机器加负担】!以下是头铁的用python产生的问题收录在案:

①UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte,Unicode解码错误:“utf-8”编解码器无法解码位置0中的字节0xc8:无效的连续字节。

str以byte存储传输,在磁盘中读取的都是byte,现在无法转换成str,python就会报错。

解决方法①:encoding='unicode_escape'对编码后存储的文本,读取时进行反向转换,直接得到原始文本数据。

解决方法②:encoding='GB18030',GB18030是最新的中文编码包含少数民族文字。GB18030兼容GBK兼容GB2312,建议中文信息直接使用GB18030。

②ValueError: name already used as a name or title。名字已经被使用,如果表头存在重名,python就会报错。

以下是讨巧的方法:

如果open+pd.read_csv(),当然你表中没有汉字等类似的字符,不要open,所以不是不可,建议英文数字制表!

f = open(str)  # str就是文件路径名,记得带引号

pd.read_csv(f)  # 生成一个DataFrame数据类型就可以为所欲为了

猜你喜欢

转载自blog.csdn.net/lizhyangmm/article/details/128013649