decode与encode解码问题

编程语言 2019-05-01 21:04:53 阅读次数: 0

在python中unicode中的type为str,gbk/utf-8的类型为byte，如下图

unicode，utf-8，gbk之间的转换,需要先转为unicode

核心是不管怎么转都要先转换成unicode，因此需要解码decode先。utf-8 <---> unicode <---> gbk

转换例子：

s=u'小明'

#编码为utf-8

s_utf = s.encode('utf-8')

#变为为gbk,先解码为unicode，再编码

s_gbk = s_utf.decode('utf-8').encode('gbk')

结果如下图所示,utf-8一个中文占3个字节，gbk两个字节

2.解决error：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0

Python 编码中编码解码的问题，我这个错误就是‘utf-8’不能解码位置0的那个字节（0xa1），也就是这个字节超出了utf-8的表示范围了

解决办法：

stopwords = pd.read_csv("stopwords.txt",index_col=False,quoting=3,sep=" ",names=['stopword'],encoding='gb18030')
也就是在读取数据的时候，显式添加编码方式encoding='gb18030'

猜你喜欢

转载自blog.csdn.net/fanyao1983/article/details/89739261

decode与encode解码问题

python 编码（encode）解码（decode）问题

python decode encode 解码与编码问题

关于编码和解码问题——encode、decode

Python解决抓取内容乱码问题（decode和encode解码）

python encode decode 编码解码

python中的decode（编码）和encode（解码）

HTML的Encode(转码)和解码(Decode)

Python基础-encode编码和decode解码

Python中编码encode()与解码decode()

python3编解码 encode decode

python 编码问题 decode or encode

js 中编码（encode）和解码（decode）的三种方法(传递是特殊符号丢失问题，如‘+’)

【转】Python字符串的编码与解码(encode与decode)

javascript处理HTML的Encode(转码)和Decode(解码)总结

javascript处理HTML中Encode(转码)和Decode(解码)的方法

python中字符编码encode与解码decode的使用方法

#Python中os中编码encode与decode 解码

Java进行Base64的编码(Encode)与解码(Decode)

Base64的编码(Encode)与解码(Decode)？java

【爬虫】编码或解码（decode，encode）报异常的处理方式

【转】javascript处理HTML的Encode(转码)和Decode(解码)总结 javascript处理HTML的Encode(转码)和Decode(解码)总结

encode decode

decode encode

encode与decode

decode、encode

探究 encode 和 decode 的使用问题（Python）

Python 关于 encode与decode 中文乱码问题

python3编码问题 encode decode

python编码问题之encode、decode、codecs模块

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)