python3解码utf-8明文 - 代码天地

python3解码utf-8明文

其他 2020-03-15 15:00:51 阅读次数: 0

如果遇到 '\\xe4\\xb8\\xad\\xe5\\x9b\\xbd' 这样的utf-8明文字符串，并且不是在代码里，而是从别的地方获取的，无法更改，就需要特殊的解码方式

在python2中，可以直接用decode("string_escape")解决，但是python3中str类型无法decode，那么怎么办呢？

有两种方法，第一种来自stackoverflow

https://stackoverflow.com/questions/26311277/evaluate-utf-8-literal-escape-sequences-in-a-string-in-python3


s = r'\xe4\xb8\xad\xe5\x9b\xbd'

c = s.encode().decode('unicode-escape').encode('raw_unicode_escape').decode('utf-8')

print(c)

没错，decode('unicode-escape')之后，字符串实际上变成了'\xe4\xb8\xad\xe5\x9b\xbd'，然后就可以用常规的.encode('raw_unicode_escape').decode('utf-8')解决

第二种方法来自知乎

python3的编码有哪些坑？ - 哈哈哈的回答 - 知乎 https://www.zhihu.com/question/60231684/answer/1076033667

s = r'\xe4\xbd\xa0\xe5\xa5\xbd'
eval("print('"+s+"'.encode('raw_unicode_escape').decode('utf-8'))")

#写成函数
def getUtf8Escape(s):
    d = []
    eval("d.append('" + s + "'.encode('raw_unicode_escape').decode('utf-8'))")
    return d[0]

print(getUtf8Escape(s))

简单粗暴的方法，但确实有效

顺带一提，如果是Unicode的明文，或者没有\\转义的utf-8，其实很简单

#Unicode明文
a = r'\u8bf7'

b = a.encode().decode("unicode_escape")

print(b)

#utf-8
a = '\xe4\xbd\xa0\xe5\xa5\xbd'

b = a.encode('raw_unicode_escape').decode('utf-8')

print(b)

猜你喜欢

转载自www.cnblogs.com/LiuZhongbin888/p/12486978.html

python3解码utf-8明文

python3的url编码和解码，自定义gbk、utf-8

ASCII，UTF-8，GBK 及 Python3中的编码解码

python3 unicod,utf-8,gbk的编码和解码中文显示问题

python3 cgi中utf-8乱码问题

python3 中将utf-8编码与汉字

Python3 读取 toml 配置文件（UTF-8/UTF-8-BOM）

unicode,bytes,中文(utf-8/gbk) 编解码 | python

python 网址utf-8编码还有解码

Python3编码问题 Unicode utf-8 bytes互转

python3 error : 解决UnicodeDecodeError 'utf-8' codec can't decode byte..问题

python3 中的reload（sys）和sys.setdefaultencoding('utf-8')

python3 中的编码问题 unicode, utf-8, gbk, ascii

python3：(unicode error) 'utf-8' codec can't decode

Python3:UTF-8编码字符串转换中文、Unicode编码

#!/usr/bin/env python3和# -*- coding: utf-8 -*-

python3 windows utf-8运行报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 13: in

js中的UTF-8编码与解码

get请求utf-8解码

网页地址编码解码（网页地址明文密文转换）url编码解码 Python3

Python3错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 解决方法

python3 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 167

Python3解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题终极解决方案

python3 web.py模块中使用template出错无法打开utf-8编码的文件

Python3解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte..问题终极解决方案

二十六、python中字符串的编码与解码，utf-8编码与解码，gbk编码与解码

Python3解决UnicodeDecodeError:'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

python3 网络爬虫报错“UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position”解决方案

python3的web开发中出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid star

发现python3的一个天坑问题：报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa3 in position 59: invalid

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)