Python基础小常识(四)

单个字次数统计输出:

文字读取
>>> txt=open("C:\\WEXAM\\000000000000\\文本.txt","r").read()
标点符号识别
>>>for ch in ",。 ? : " :
	txt = txt.replace(ch,"")
读取并统计
>>>d = {}
>>> for ch in txt:
      d[ch]=d.get(ch,0)+1
>>> ls=list(d.items())
>>> ls.sort(key=lambda x:x[1],reverse=True)
>>> a,b=ls[0]
>>> print("{}:{}".format(a,b))
的:2557
输出词频统计top10
ls.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
	print(str(ls[i])[2],end="")

	
的\"一我了是不有他

猜你喜欢

转载自blog.csdn.net/tandelin/article/details/88372927
今日推荐