【Python-ERROR】‘gbk‘ codec can‘t encode character ‘\xa0‘ or ‘\u2003‘ in position XXX

企业开发 2022-04-21 07:44:13 阅读次数: 0

Python在print输出时解码报错

1. 遇到的错误
2. 解决办法
3. 参考文章

1. 遇到的错误

在通过Python爬取网页时，通过print函数输出内容进行调试，但是总会遇到解码不了的字符，试过各种方法都不行，错误代码如下：

‘gbk’ codec can’t encode character ‘\xa0’ in position 8186: illegal multibyte sequence
‘gbk’ codec can’t encode character ‘\u2003’ in position 7254: illegal multibyte sequence

2. 解决办法

1. 提取的信息中有“\xa0”，并且无法去掉，查阅了相关资料，后发现该字符表示空格。

\xa0 是不间断空白符  
我们通常所用的空格是 \x20 ，是在标准ASCII可见字符 0x20~0x7e 范围内。而 \xa0 属于 latin1 （ISO/IEC_8859-1）中的扩展字符集字符，代表空白符nbsp(non-breaking space)。latin1 字符集向下兼容 ASCII （ 0x20~0x7e ）。

可以利用translate方法、split()解决，并且还可以替换\t \n字符，以split()为例：

>>> s
'T-shirt\xa0\xa0短袖圆领衫,体恤衫\xa0'
>>> out = "".join(s.split())
>>> out
'T-shirt短袖圆领衫,体恤衫'

2. 提取信息中有’\u2003’，在代码开头加上下面的代码也可以解决：

import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

3. 当然还有就是可以把print注释掉，但是注释了调试的时候不方便。

3. 参考文章

https://blog.csdn.net/wangbowj123/article/details/78061618
https://blog.csdn.net/qq_39241986/article/details/87896088
https://blog.csdn.net/a_xixi/article/details/88030830

猜你喜欢

转载自blog.csdn.net/Artificial_idiots/article/details/121474878

【Python-ERROR】‘gbk‘ codec can‘t encode character ‘\xa0‘ or ‘\u2003‘ in position XXX

解决在pycharm中出现UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX

【编码】UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX

【编码】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position XXX

编码问题：UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position 148:

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence

解决UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 0问题

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 298290: illegal multibyte

'gbk' codec can't encode character '\xa0' in position 12248: illegal multibyte sequence

'gbk' codec can't encode character '\xa0' in position 34: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 46:illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 67008: illegal multibyte s

解决："UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position"错误

UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position xxx:illegal multibyte ...

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0'

[python3 - TroubleShooting] UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 27: illegal multibyte sequence

Python3 解决编码问题： `UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: ille

python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 4400: illegal multibyte sequence

python中写入文件时UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 44: illegal mu

另一种解决方式：编码问题：UnicodeEncodeError: ‘gbk‘ codec can‘t encode character u‘\xa0‘ in position 148:

报错处理（UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2: ill egal multibyte sequence）

爬虫编码问题 'gbk' codec can't encode character '\xa0' in position 1816: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 问题解决办法之一

python下字符编码和解码问题：UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0'

解决python2.7 运行报 UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 0: illega

Python print 输出文本显示UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 30: illegal multibyte sequence

bs4 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0'

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)