【Python】将gbk编码的文件转为Unicode编码

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/meiqi0538/article/details/87989471

程序背景

编码一直是程序员困扰的问题,如何使用python将gbk编码的文件转为utf8编码?其实也不难,主要使用python中的一个包(自带):codecs。相对于其他编程语言来说,这个是相当便捷的,当然你也可以使用记事板,notepad++受动修改编码。废话不多说,下面就是代码实现。

代码实现


import os
import codecs
import sys


def main(file1, file2 ):
    """将gbk编码的文件转为utf8编码的文件
    :param file1: gbk编码的文件
    :param file2: utf8编码的文件
    :return:
    """
    # 读取原文
    with open(file1, "r", encoding="gbk") as f:
        results = f.readlines()
    # 开始遍历读取结果,并写到新的文件中
    with codecs.open(file2, "w", encoding="utf-8") as f:
        for result in results:
            f.write(result)
    print("转码成功!转码后文件为:", file2)


if __name__ == '__main__':
    param = sys.argv      # 获取控制台
    if len(param) == 3:
        src_file = param[1]
        dest_file = param[2]
    elif len(param) == 1:
        src_file = "1998-01-2003版-带音.txt"
        dest_file = "utf8_1998-01-2003版-带音.txt"
    else:
        print("文件无效")
        sys.exit()
    main(src_file, dest_file)

原文及个人博客

其原文为:【python】将gbk编码的文件转为Unicode编码
原文在发表在我个人的博客网站上,该博客网站是基于node.js + hexo + md + github等技术完成。

猜你喜欢

转载自blog.csdn.net/meiqi0538/article/details/87989471
今日推荐