中英文统计 - 代码天地

中英文统计

其他 2018-10-15 11:43:50 阅读次数: 0

第一种方法：

fo=open("sunstr.txt","r",encoding="utf-8")
sunstr=fo.read().lower()
for ch in ",.":
    sunstr.replace(ch," ")
sunstr = sunstr.split();
sunstrset = set(sunstr)

dic = {}
for i in sunstrset:
    dic[i] = sunstr.count(i)
print(dic)


for key in dic:
    print(key,dic[key]);

wcList = list(dic.items())

def tskeSecond(elem):
    return elem[1]

wcList.sort(key=tskeSecond,reverse=True)
print(wcList)

　　

第二种方法：

def getTxt():
    txt = open("sunstr.txt").read()
    txt = txt.lower()
    for ch in '!"@#$%^&*()+,-./:;<=>?@[\\]_`~{|}':
        txt.replace(ch," ")
    return txt
# sunstr = sunstr.replace(","," ")

sunstr = getTxt().split()
sunstrset = set(sunstr)

dic = {}
for i in sunstrset:
    dic[i] = sunstr.count(i)
print(dic)


for key in dic:
    print(key,dic[key]);

wcList = list(dic.items())

def tskeSecond(elem):
    return elem[1]

wcList.sort(key=tskeSecond,reverse=True)
print(wcList)

　　

中文统计：

import jieba
word =open("123.txt","r",encoding="utf-8").read()
 
for ch in "，。“”":
    word = word.replace(ch,"")
 
word = jieba.cut(word)
word = list(word)
print(word)
 
 
wordset =set(word)
worddic ={}
 
for i in wordset:
    worddic[i]= word.count(i)
print(worddic)
 
wcList = list(worddic.items())
wcList.sort(key=lambda x:x[1],reverse=True)
print(wcList)

　　

猜你喜欢

转载自www.cnblogs.com/sunyubin/p/9790019.html

中英文统计

完整的中英文词频统计

中英文词频统计

中英文分句

中英文换行

阶段作业1：完整的中英文词频统计

文本中英文单词的统计个数

统计小说《飘》中英文单词

c语言统计中英文字符

Python统计pdf中英文单词的个数

中英文混合排序

eclipse中英文互转

UIDatePicker中英文显示

BIOS中英文对照

Mysql 中英文排序

Eclipse 中英文配置

浅谈中英文排版

python中英文对照

中英文词频

前端中英文互译

中英文分词分句

Qt中英文匹配

HTML中英文对照

页面中英文的转换

java 判断中英文

swagger支持中英文

PHP 判断中英文

qt中英文处理

ocis code中英文

js中英文排序

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)