python3 urllib.request.urlopen() 错误UnicodeEncodeError: 'ascii' codec can't encode characters - 代码天地

python3 urllib.request.urlopen() 错误UnicodeEncodeError: 'ascii' codec can't encode characters

其他 2018-09-16 21:12:47 阅读次数: 0

代码内容：

url = 'https://movie.douban.com/j/search_subjects?type=movie'+ str(tag) + '&sort=recommend&page_limit=20&page_start=' + str(limit)
response = urllib.request.urlopen(url, timeout=20)
result = response.read().decode('utf-8','ignore').replace(u'\xa9', u'')
result = json.loads(result)

错误内容为：上述第二行代码报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 28-29: ordinal not in range(128)

1 认为是代码错误，或者是tab缩进错误

2 百度搜索后得出如下分析：

Python在安装时，默认的编码是ascii，当程序中出现非ascii编码时，python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)，python没办法处理非ascii编码的，此时需要自己设置将python的默认编码，一般设置为utf8的编码格式。

但是在我使用的python3.6.5 默认就是utf8编码格式，所以也不存在这种问题。我使用print(type(str))后输出的也是str。

3 发现python3 urlopen()链接地址中不能出现中文，而上述代码的tag是传入的中文字符，终于找到了问题的所在。

解决办法：

使用urllib.parse.quote进行转换。

url = 'https://movie.douban.com/j/search_subjects?type=movie&tag=' + str(tag) + '&sort=recommend&page_limit=20&page_start=' + str(limit)
url = quote(url, safe=string.printable)
response = urllib.request.urlopen(url, timeout=20)
result = response.read().decode('utf-8','ignore').replace(u'\xa9', u'')
result = json.loads(result)

程序头部需要添加

from urllib.parse import quote

同时需要import string导入string模块

方法quote的参数safe表示可以忽略的字符。

string.printable表示ASCII码第33～126号可打印字符，其中第48～57号为0～9十个阿拉伯数字；65～90号为26个大写英文字母，97～122号为26个小写英文字母，其余的是一些标点符号、运算符号等。

如果去掉safe参数的内容将会出错。

猜你喜欢

转载自blog.csdn.net/qq_25406563/article/details/81253347

python3 urllib.request.urlopen() 错误UnicodeEncodeError: 'ascii' codec can't encode characters

UnicodeEncodeError: 'ascii' codec can't encode characters

Python——UnicodeEncodeError: 'ascii' codec can't encode/decode characters

python3 UnicodeEncodeError错误，cx_oracle模块执行sql报错：UnicodeEncodeError: 'ascii' codec can't encode characters in position

Docker 错误解决：python 提示错误UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position

Python3—UnicodeEncodeError 'ascii' codec can't encode characters in position 0-1

(转) Python3—UnicodeEncodeError 'ascii' codec can't encode characters in position 0-1

Python3中遇到UnicodeEncodeError: ‘ascii’ codec can’t encode characters in ordinal not in range(128)

Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)

docker python3 编码问题：UnicodeEncodeError: 'ascii' codec can't encode characters in position...

转UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position

解决 UnicodeEncodeError: 'ascii' codec can't encode characters in position 问题

解决UnicodeEncodeError: 'ascii' codec can't encode characters in position问题

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position…

解决UnicodeEncodeError: 'ascii' codec can't encode characters in position

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position ..

解决urllib3请求中文参数报错：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 185-18

python UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-3:

[错误解决]UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)

macOS解决sublime text3运行python3报：UnicodeEncodeError: 'ascii' codec can't encode characters in position

Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128) Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)

Python3中遇到UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in ordinal not in range(128) Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)

Python3中出现UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)的解决方法

python3编码问题(UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-2: ordinal not )

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)

已解决UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-3: ordinal not in range(1

最新方案-解决编码错误问题：UnicodeEncodeError: 'ascii' codec can't encode characters in position

python 字符编码print 出错。UnicodeEncodeError: 'ascii' codec can't encode characters in position

python 编码问题 UnicodeEncodeError: 'ascii' codec can't encode characters in position 37-40

python 读写文件时报UnicodeEncodeError: 'ascii' codec can't encode characters in

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)