Python使用Opencc库完成字符繁简体转换

背景

在日常工作中,我们常常会遇到转换中文字符繁简体的情况。接下来,我该大家介绍一个很强大的Python库,用来方便的处理字符转换。

OpenCC简介

Opencc(Open Chinese Convert)是一个开源的中文繁简体转换项目,作者是目前任职于Google的BYVoid。详细信息请看官网(https://code.google.com/p/opencc)。

OpenCC-Python安装

OpenCC支持Mac、Linux、Windows平台安装,由于我的电脑是Windows系统,下面只介绍Windows下的安装:
  1. 你需要访问这个网址(http://download.csdn.net/download/tab_space/9455349),下载一个叫做distribute-setup.zip的安装包。
  2. 解压缩这个安装包,把里面的distribute_setup.py文件放到你的Python的Lib目录中去,如果你不知道Lib目录是什么,可以用下述方法大概查看一下:
In: import sys
In: sys.path
Out:#你的Python目录

我把它放入了’C:\Anaconda\lib’中。

  1. 然后打开CMD,键入pip install opencc-python,就可以使用了

使用示例

from opencc import openCC
#繁转简
c = openCC('t2s')
#设置测试数据
data = u'Open Chinese Convert(OpenCC)是一個開源的中文簡繁轉換項目,致力於製作高質量的基於統計預料的簡繁轉換詞庫。還提供函數庫(libopencc)、命令行簡繁轉換工具、人工校對工具、詞典生成程序、在線轉換服務及圖形用戶界面'
data_new = c.convert(data)
print data_new

下面是输出结果

Out:Open Chinese Convert(OpenCC)是一个开源的中文简繁转换项目,致力于制作高质量的基于统计预料的简繁转换词库。还提供函数库(libopencc)、命令行简繁转换工具、人工校对工具、词典生成程序、在线转换服务及图形用户界面

猜你喜欢

转载自blog.csdn.net/sjz_hahalala479/article/details/71551952
今日推荐