urllib，url中链接包含汉字怎么处理 - 代码天地

urllib，url中链接包含汉字怎么处理

其他 2018-10-20 18:28:20 阅读次数: 0

使用urllib中的quote，和unquote方法将汉字编码成gbk（2个百分号对应一个汉字）或者utf8（3个百分号对应一个汉字）

注意用%加密汉字时，汉字不能是Unicode编码格式，否则会报错（解决办法：把Unicode编码的中文转换成str格式----->另一篇博客短文有）

>>> import sys,urllib

>>> s = '汉字'
>>> type(s)
<type 'str'>
>>> s
'\xba\xba\xd7\xd6'
>>> s1 = u'汉字'
>>> type(s1)
<type 'unicode'>
>>> s1
u'\u6c49\u5b57'

　

>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%BA%BA%D7%D6'
>>> urllib.quote(s1.decode(sys.stdin.encoding).encode('gbk'))

Traceback (most recent call last):
  File "<pyshell#20>", line 1, in <module>
    urllib.quote(s1.decode(sys.stdin.encoding).encode('gbk'))
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

　　

　

>>> urllib.quote(s)
'%BA%BA%D7%D6'
>>> urllib.quote(s1)

Traceback (most recent call last):
  File "<pyshell#22>", line 1, in <module>
    urllib.quote(s1)
  File "D:\Python27\lib\urllib.py", line 1298, in quote
    return ''.join(map(quoter, s))
KeyError: u'\u6c49'

　　

猜你喜欢

转载自www.cnblogs.com/chillytao-suiyuan/p/9822430.html

urllib，url中链接包含汉字怎么处理

url中包含中文处理

c#怎么判断字符串中包含汉字?

PHP怎么对Url中的汉字进行编码和解码？

链接（url）中不能有汉字，遇到汉字，需要使用quote转换之后使用

url 中包含多层URL参数的编码解码处理

爬虫url 汉字处理

java -- 路径中包含空格怎么处理

urllib 中的异常处理

URL链接中汉字乱码转UTF-8和gb2312

Ajax 请求：url参数中包含 “#“ 特殊字符的处理

python爬虫 urllib模块url编码处理

处理urlparse/urllib.parse中修改url参数结果的奇思异想

JAVA 中URL链接中文参数乱码的若干处理方法

关于url链接包含中文编码问题

url中urllib.parse小技巧

Python URL地址中汉字的编码转换

python3 使用urllib.parse对url进行处理

python爬虫 urllib模块url编码处理详解

怎么在重定向的时候在url地址列里面拼接汉字？

spring security关于URL中包含双斜杠被权限拦截的处理

在传参时,url参数中包含+、空格、=、%、&、#等特殊符号的处理

url链接中抽取参数

python 读取配置文件里面包含汉字的处理

C/C++中多个库相互包含时，链接器的处理规则

urllib中的URLError与HTTPError的异常处理

Swift中url的处理

URL 中的中文处理

判断字符串中是否包含汉字

Java判断字符串中是否包含汉字

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)