解决UnicodeDecodeError: ‘utf-8‘的通用方法

企业开发 2023-04-08 00:31:34 阅读次数: 0

BUG场景：

使用pandas读取csv文件时出现UnicodeDecodeError: 'utf-8'的报错

df = pd.read_csv('test.csv')

原因分析：

文件编码问题，这里的解决思路是使用相应的encoding方法打开。

解决方案：

网上我个人没找到比较通用的解决方法，所以这里记录一下自己的解决方法。

import chardet

def find_encodeing(file_path, read_byte):

    with open(file_path, 'rb') as rawdata:
        result = chardet.detect(rawdata.read(read_byte))
    print(result)
    return result['encoding']

//打印如下
{'encoding': 'Windows-1252', 'confidence': 0.73, 'language': ''}

这里根据自己的文件大小去设置read_byte的大小，然后可以大致知道文件的编码格式，然后再用read_csv的方法打开就好了

df = pd.read_csv('test.csv', encoding='Windows-1252')

猜你喜欢

转载自blog.csdn.net/lzzzzzzm/article/details/123451762

解决UnicodeDecodeError: ‘utf-8‘的通用方法

UnicodeDecodeError: 'utf-8'错误

Python3错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 解决方法

pycharm debug出现UnicodeDecodeError: 'utf-8' codec can't decode 解决办法

运行learning.py出现unicodedecodeerror...'utf-8'错误无法解决的问题

TensorFlow学习笔记（UTF-8 问题解决 UnicodeDecodeError)

python3 error : 解决UnicodeDecodeError 'utf-8' codec can't decode byte..问题

python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

解决Django:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcb in position 325

(2020.1.2已解决)pyinstaller || UnicodeDecodeError:'utf-8' codec can't decode byte Oxce in position 118

pyshp UnicodeDecodeError解决方法

python利用pandas读取csv报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8...解决方法

成功解决(不可思议的解决方法)UnicodeDecodeError utf-8 codec cant decode byte 0xd2 in position 3484 invalid con

【转载】Pyinstaller打包出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position问题的解决方法

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x87 in position 10: invalid start byte解决方法

解决rspec 生成报告时报utf-8错误的方法

Python3解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题终极解决方案

Python3解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte..问题终极解决方案

Pyinstaller打包出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 解决方案

解决 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 5: invalid start byte

py文件增加encoding='utf-8',errors='ignore' 后仍然没解决UnicodeDecodeError: 'gbk' codec can't decode byte

【转载】Pyinstaller打包出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 解决方案

成功解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

成功解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 130: invalid continuation

解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid continuation byte

【已解决】pyinstaller UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xce in position 110: invalid continuation byte

解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte问题

解决linux 终端UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid continuation byte

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid continuation byte解决

成功解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 3150: invalid continuation

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)