Python处理字符串中文（汉字）编码示例 - 代码天地

Python处理字符串中文（汉字）编码示例

编程语言 2023-08-15 19:34:11 阅读次数: 0

在实际开发中，发现打印Python打印经常出现乱码，大部分都是编码引起，这里只是简单说一下utf-8/ gbk/ unicode编码之间的相互转换问题：

utf-8是Unix下的一种通用编码，gbk是win环境下的一种汉字编码，unicode是一种二进制编码，所有的utf-8和gbk编码都得通过unicode编码进行转码如图：

首先，我们可以查看自己的字符串是什么编码格式：

注意：在Python3 中，需要将strTest转换成二进制，再获取编码格式；而在2.x时，不需要转换，之接传入：print chardet.detect(strTest)

import chardet

strTest = "这是一个测试用例"
    
print(chardet.detect(str_test.encode()))

得到输出结果：

然后根据你的需要转码：如 xxx.decode('utf-8').encode('gbk')

python中有两个函数 decode() 和 encode()

decode(‘utf-8’) 是从utf-8编码转换成unicode编码，当然括号里也可以写'gbk'

encode('gbk') 是将unicode编码编译成gbk编码，当然括号里也可以写'utf-8'

str_to_gbk = str_test.encode('gbk')
print(chardet.detect(str_to_gbk))

另外，有些时候，我们输出打印时，会出现中文打印是 \uxxx 等，可以试试以下代码：

xxx.encode('utf-8').decode('unicode_escape')

猜你喜欢

转载自blog.csdn.net/u012402739/article/details/128610023

Python处理字符串中文（汉字）编码示例

C/C++中文的编码和字符串处理

PYTHON 字符串编码

Python字符串-编码

python字符串编码

深入理解python（三）python字符编码和字符串处理

Python中的字符串与字符编码

Python中文编码问题(字符串前面加'u')

Python中文编码问题——字符串前面加u

python Unicode编码字符串转中文

字符串编码与Python 3编码

Python2和Python3之间关于字符串编码处理的差别

处理字符串将字符串中的unicode字符转为汉字

python:正确的对未知编码的字符串进行预处理-Unicode-UTF8-gbk

python中字符串和编码

python字符串基本编码

Python基础四：字符串及编码

python字符串编码判断

python字符串编码问题

python字符串的编码格式

Python字符串和编码

Python的字符串和编码

Python中的编码和字符串

python字符串的编码问题

Python_字符串与编码

FME Python字符串编码

Python笔记——字符串编码

lisoaring python 字符串编码

python中的字符串和编码

Python字符串编码转换

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)