Python decode报错UnicodeDecodeError: ‘gb2312’ codec can’t decode byte - 代码天地

Python decode报错UnicodeDecodeError: ‘gb2312’ codec can’t decode byte

其他 2019-04-21 14:24:43 阅读次数: 0

今天用python采集文章的时候发现有些中文会出现解码出错，UnicodeDecodeError: ‘gb2312’ codec can’t decode byte 0xb0 in position 18020: illegal multibyte sequence 百度了发现是繁体字之类的gb2312会出现错误，

直接用errors = 'ignore'忽略

html.decode("gb2312",errors = 'ignore')

因为decode的函数原型是decode([encoding], [errors='strict'])，可以用第二个参数控制错误处理的策略，默认的参数就是strict，代表遇到非法字符时抛出异常；
如果设置为ignore，则会忽略非法字符；
如果设置为replace，则会用?取代非法字符；
如果设置为xmlcharrefreplace，则使用XML的字符引用。

猜你喜欢

转载自www.cnblogs.com/xxxuxin/p/10744931.html

Python decode报错UnicodeDecodeError: ‘gb2312’ codec can’t decode byte

Python报错：UnicodeDecodeError: 'gbk' codec can't decode byte ...

python 报错：UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 33-34: illegal multibyte

解决python错误 UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8b in position 1: illegal multibyte sequence

'gb2312' codec can't decode byte 0x89 in position 。。。。解决方法

UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xc4 in position 21635: illegal multibyte seque

python3 爬取网页报错：'gb2312' codec can't decode byte 0xb5 in position 154969: illegal multibyte sequence

【python问题解决】UnicodeDecodeError ：'gb2312' codec can't decode bytes：illegal multibyte sequence

python：UnicodeDecodeError：‘ascii’ codec can't decode byte

解码错误。'gb2312' codec can't decode byte 0xf3 in position 307307: illegal multibyte sequence

解码错误。‘gb2312‘ codec can‘t decode byte 0xf3 in position 307307: illegal multibyte sequence

UnicodeDecodeError: 'ascii' codec can't decode byte

pyquery报错：UnicodeDecodeError: 'gbk' codec can't decode byte

PyInstaller 打包出错 UnicodeDecodeError ：'gb2312' codec can't decode bytes：illegal multibyte sequence

Python报错UnicodeDecodeError: ascii codec can t decode byte 0xe0 ...解决方法

python转exe报错 UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in pos

(mac) python中UnicodeDecodeError: 'utf-8' codec can't decode byte 报错

python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

解决Python打开文件报错UnicodeDecodeError: 'gbk' codec can't decode byte

Python 报错 ‘UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xad in position 123: illegal multibyt’

一文搞懂Python文件读取报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte

python问题：UnicodeDecodeError: 'utf-8' codec can't decode byte in position : invalid start byte

【python】python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence

记一次读取csv报“'gb2312' codec can't decode byte 0x9b”解决办法

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

python报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 4: ordinal not in range

解决python3报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xaa in position 1: ordinal not in ra

python执行报错“UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 110: illegal multibyte sequence”

python 打开文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 31: illegal multiby

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)