Python练习册(四)——统计英文单词

problem0004统计英文单词

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。

demo:

#!/bin/python3

import re
def get_word_frequencies(file_name):
    dic = {}
    txt = open(file_name, 'r').read().splitlines()
    no_flag=0
    for line in txt:
        line = re.sub(r'[.?!,""/\W]', ' ', line)   #要替换的标点符号,英文字符可能出现的
        for word in line.split():
            #当字符为纯数字的时候,跳过不统计
            if word.isdigit():
                    pass
       #         print("number is ++++++++++++++++++++:",word)
            else:
                dic.setdefault(word.lower(), 0)  #不区分大小写
                dic[word.lower()] += 1
    print (dic)

if __name__ == '__main__': 
       get_word_frequencies("WhatisPython.txt")   

参考:[Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)

效果:

原文本:
这里写图片描述
统计图:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_30650153/article/details/80866844