数5および出力、高頻度語の前に統計資料

jiebaインポート

LSを = 中国は、偉大な国では良い国だ
(印刷として元の文書:、LS)
カウント = {}#定義統計辞書
の単語 = jieba.lcut(LS)
を印刷(良い点フレーズである:' ワード)

のための単語単語:
    カウント[単語] =カウントがGET(ワード、0)+ 1枚の。
プリント(' 生成辞書があるが:')をカウント
プリント(辞書の要素:' 、 counts.items())
リストに#辞書のタプル
項目 =一覧(counts.items())
を印刷(カウントが要素の新しいリストを生成する:、項目)
#第二のリストを値でソートされている - DESC =リバース真、昇順デフォルト
Items.Sortを(キー =ラムダX:X [ 1。 =リバース] TRUE)

印刷(二次元のためにタプルのリストによると:、項目)
#転送リストをフロント5 
ための I における範囲(5 ):
    ワード、COUNT = 商品[ I] 
    印刷(" {0:<--- {10} 1:>}。5 " .format(ワード、COUNT))

#-----------------------
以下のためのWord :言葉
     のIF(ワード)== lenを。1 :#は、フレーズを追加するかどうかを判断し
         続けて
    
        カウント[ワード]を。=カウントがGET(ワード、0)+ 1。

 

おすすめ

転載: www.cnblogs.com/huigebj/p/11433878.html