[Python2.x] 保存中文的unicode编码到json文件中的方法 - 代码天地

[Python2.x] 保存中文的unicode编码到json文件中的方法

其他 2019-04-30 11:20:59 阅读次数: 0

目的：将包含中文的文件名中的中文转换为unicode编码字符串保存在json文件中。

文件名：你真好.gif

目标json文件内容格式: {"\u4F60\u771F\u597D":["4213fb4c242ed5a32e845dddc7c75770.gif"]}

# -*- coding:utf-8 -*-

# 获取文件的MD5字符串
import md5, hashlib
def getmd5(filepath):
    f = open(filepath,'rb')
    m2 = hashlib.md5()
    m2.update(f.read())
    f.close()
    return m2.hexdigest()

# 扫描当前路径下的所有文件
data = {}
for f in glob.glob(path + r'\*'):
    if not os.path.isdir(f):
        p, fname = os.path.split(f)
        name, ext = os.path.splitext(fname)
        name = name.decode("gbk")  # name = ''.join(name.decode("gbk")), 这两个语句的结果是等价的"\u4f60\u771f\u597d"

        value = getmd5(f)   # "4213fb4c242ed5a32e845dddc7c75770", 你真好.gif文件的MD5文本串

        data[word] = [value + ext]  

# 保存文本内容：{"\u4F60\u771F\u597D":["4213fb4c242ed5a32e845dddc7c75770.gif"]}
open(OUTPUT_FILE_PATH, mode='w').write(json.dumps(data))

实现过程中发现，下面的方法不符合输出的格式要求：

...
name, ext = os.path.splitext(fname)
stringList = []
for word in name:
    stringList.append("\\u%04X" % (ord(word)))
name = ''.join(stringList) 
...

以上代码在保存到json文件中的内容如下：

{"\\u4F60\\u771F\\u597D":["4213fb4c242ed5a32e845dddc7c75770.gif"]}

猜你喜欢

转载自blog.csdn.net/youngwhz1/article/details/81867127

[Python2.x] 保存中文的unicode编码到json文件中的方法

python2.x中的编码

python2.x 默认编码问题

python2.X中文乱码

python2.x 脚本中文乱码解决方法

解决Python2.x编码之殇

Python2.x中文乱码问题解决

python2.x os模块常用方法

Python2.x中str与unicode相关问题的解决方法

python2.X和python3.X中的urllib、urllib2，以及Request

python2.x和3.x中的字符串编码问题

每日一拍：linux升级python2.x到python3.x

CentOS7 升级 Python2.x 到 Python3.x

centos下Python2.X升级到Python3.X

python2.x到python3.x函数变化

python2.X升级到python3.x后，解决yum报错的问题

python2.x脚本转换为python3.x脚本的方法

python2.x 和python3.x 中urllib的区别，并简单使用

Python2.X/Python3.X中urllib库区别讲解

centos7升级Python2.x到3.x

CentOS7 升级Python2.x到3.x

CentOS7 64位升级 Python2.x到3.x

使用2to3.py 转换 python2.x 代码到python3

Python2.x中文乱码问题解决方法

Ubuntu16.04系统Python2.x 升级到3.6.5

文件夹下匹配条件删除文件的python2.x脚本

在pycharm中配置从Python2.x到3.x的转换工具（新手向）

mac下python2.x和python3.x的安装方法和升级方法/卸载

记录一下 python2.x 和 python3.x 中urllib库的变化情况

__getattr__在python2.x与python3.x中的区别及其对属性截取与代理类的影响

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)