第六章：文件系统-codecs:字符串编码和解码-处理文件 - 代码天地

第六章：文件系统-codecs:字符串编码和解码-处理文件

其他 2019-03-19 19:40:53 阅读次数: 0

6.10.2 处理文件
处理I/O操作时，编码和解码字符串尤其重要。不论是写至一个文件、套接字还是其他流，数据都必须使用适当的编码。一般来讲，所有文本数据在读取时都需要由其字节表示解码，写数据时则需要从内部值编码为一种特定的表示。程序可以显式地编码和解码数据，不过取决于所用的编码，要想确定是否已经读取足够的字节来充分解码数据，这可能并不容易。codecs提供了一些类来管理数据编码和解码，所以应用不再需要做这个工作。
codecs提供的最简单的接口可以替代内置open()函数。这个新版本的函数与内置函数的做法很相似，不过增加了两个参数来指定编码和所需的错误处理技术。

from codecs_to_hex import to_hex

import codecs
import sys

encoding = sys.argv[1]
filename = encoding + '.txt'
print('Writing to',filename)
with codecs.open(filename,mode='w',encoding=encoding) as f:
    f.write('francais')

# Determine the byte grouping to use for to_hex().
nbytes = {
    'utf-8':1,
    'utf-16':2,
    'utf-32':34
    }.get(encoding,1)

# Show the raw bytes in the file.
print('File contents:')
with open(filename,mode='rb') as f:
    print(to_hex(f.read(),nbytes))

这个例子首先处理一个包含c的unicode串，使用命令行上指定的编码键这个文本保存到一个文件。
运行结果：
在这里插入图片描述

用open()读数据很简单，但有一点要注意：必须提前指定编码才能正确地建立解码器。尽管有些数据格式(如XML)会在文件中指定编码，但是通常都要由应用来管理。codecs只是取一个编码参数，并假设这个编码是正确的。

import codecs
import sys

encoding = sys.argv[1]
filename = encoding + '.txt'

print('Reading from',filename)
with codecs.open(filename,mode='r',encoding=encoding) as f:
    print(repr(f.read()))

这个例子读取上一个程序创建的文件，并把得到的unicode对象的表示打印到控制台。
运行结果：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43193719/article/details/88670609

第六章：文件系统-codecs:字符串编码和解码-处理文件

第六章：文件系统-codecs:字符串编码和解码-增量编码

第六章：文件系统-codecs:字符串编码和解码-编码转换

第六章：文件系统-codecs:字符串编码和解码-错误处理-解码错误

第六章：文件系统-codecs:字符串编码和解码-字节序

第六章：文件系统-codecs:字符串编码和解码-Unicode入门

第六章：文件系统-codecs:字符串编码和解码-错误处理-编码错误

第六章：文件系统-codecs:字符串编码和解码-定义定制编码

第六章：文件系统-codecs:字符串编码和解码-非Unicode编码

第六章：文件系统-codecs:字符串编码和解码-Unicode数据和网络通信

第六章 php字符串处理(常用字符串)

Python 标准库：codecs字符串编码和解码

第六章：文件系统-glob:文件名模式匹配-转义元字符

第六章：文件系统-glob:文件名模式匹配-字符区间

第六章：文件系统-glob:文件名模式匹配-单字符通配符

第六章：文件系统-linecache:高效读取文本文件-处理空行

第六章：文件系统-shutil:高层文件操作-处理目录树

第六章 Linux系统文件的存储及权限

第六章文件的操作

第六章：文件管理

第六章文件管理

第六章文件管理

第六章：文件系统-linecache:高效读取文本文件-错误处理

第六章：文件系统-shutil:高层文件操作-文件系统空间

Python3标准库：codecs字符串编码和解码

第六章字符串各种操作函数

学习python的第四十三天-第六章字符串

Go菜鸟笔记：第六章字符串

第六章数组指针与字符串学习笔记

第六章：文件系统-shutil:高层文件操作-复制文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)