Jieba語 - 三国抜粋のボリューム上

jiebaインポート
パス = 'C:\\デスクトップユーザー\\ \\ \\管理者3王国の.txt' 
テキスト =オープン( 'UTF-8パス、 'R&LT'、=をコード').read()
の単語 = jieba。 LCUT(テキスト)
を除外 = [「一般」、「と言う」、「2」、「ない」「交渉」、「世界」、「軍曹」、「日」、「徐州」、「皇帝」 'どのように、 『軍は、実行する『 『貴族』、 『』、 『太子を』 『』』、『騎兵』、『県』、』裁判所を引用していない武器をリードする「」へ] 
カウント = {}
 のためのWord の単語:
     IF LEN(ワード)== 1。 続行
    ワードのelif == '梁'単語==または'明は言った':
        rword = '明' 
    ことばのelif == '最高'またはWordの== ' xuandeは、「言いました:
        rword)。= '備' 
    のWordのelif == '孟'またはWord == 「首相:
        rword = '曹操' 
    ことばのelif == '関'またはWord == 'クン':
        rword = '関'
     
        rword = ワード
    カウント[rword] = counts.get(rword、0)+ 1。
 ための言葉除外:
    デルカウント[単語] 
商品 = リスト(counts.items())
Items.Sort(キー =ラムダX:[1] X、 =リバースのための I におけるレンジ(15カウント=
    ワードカウント項目[I]    
    の印刷(" {0:<10}、{1:> 5} " .format(ワードカウント))

 

おすすめ

転載: www.cnblogs.com/Glzt/p/12651325.html