python读取中文（日文，韩文）文件（codecs.open与普通open的区别和使用方法） - 代码天地

python读取中文（日文，韩文）文件（codecs.open与普通open的区别和使用方法）

其他 2018-07-22 22:10:24 阅读次数: 0

读取文件，首先需要知道：一般我们使用open打开读取文件时，得到的结果一般是已经编码后的结果，编码的方式就是原先文本的编码方式。比如用utf-8格式的文件，得到的结果存入列表中为utf-8格式。如果想要查看unicode编码，我们需要对utf-8进行解码，比如：（如下例子）：

print ['\xec\xa0\x95']
print ['\xec\xa0\x95'.decode("utf-8")]
print '\xec\xa0\x95'
print u'\uc815'

output：
['\xec\xa0\x95']
[u'\uc815']
정
정

接下来如果我们想要其他的编码形式，需要用到encode进行编码：如下：

print ['\xec\xa0\x95'.decode("utf-8").encode("utf-16-le")]

output：
['\x15\xc8']

如果想要转换格式写入其他文件，过程如下：

input文件(gbk, utf-8...) ----decode-----> unicode -------encode------> output文件(gbk, utf-8...)

如果我们想用codecs，从打开文件的角度来说，codecs.open打开文件后，将结果直接保存为了unicode 的形式，因此其相当于比直接open多了一个解码的过程，如果我们想转换格式，直接用encode即可。关于codecs.write，参考：https://www.cnblogs.com/buptldf/p/4805879.html。

猜你喜欢

转载自blog.csdn.net/yg838457845/article/details/81137026

python读取中文（日文，韩文）文件（codecs.open与普通open的区别和使用方法）

python codecs.open() 读写文件

codecs.open 和一般的open 区别~

python中open，io.open和codecs.open的使用——TypeError：'encoding' is an invalid keyword argument

python 文件读写时用open还是codecs.open

pycharm--报错：codecs.open()及文件操作[及python安装pandas库失败咋解决]

python codecs.open视\u2028字符为换行符

Python txt文件读取和写入，open()打开文件和读取文件内容，.readline()和.readlines()读取文件的区别和应用，with open(file) as f的常用方法

pycharm文件位置，数据库–关于truncate和delete的区别，deletewith open()的使用方法

python with open as f 写韩文中文乱码

Python文件管理【open和with open的使用】

Python中的with open的使用方法

区别 |Python的 open() 和with open() as

python（open文件读取）

python 使用 with open() as对文件读取写入

python中的with open和 open创建文件（txt）的区别

Window open()使用方法

with open()的使用方法——3

Python文件读取(open)mode

python读取文件之with open（）

open()和with open() as的区别

open()和with open()的区别

Elasticsearch：如何使用 Elasticsearch 6.2 搜索中文、日文和韩文文本 - 第 2 部分：多字段

Elasticsearch：如何使用 Elasticsearch 6.2 搜索中文、日文和韩文文本 - 第 1 部分：分析工具

《笨方法学 Python 3》15.读取文件---open

python的open()方法,操作中文名文件问题

python open和withopen的区别

python os 文件操作 open()与with open() as的区别（打开文件）

python 中 open与with open 的区别

windows用python读取文件open（）函数

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)