l'utilisation de la bibliothèque Python jieba et l'utilisation du nuage de mots

Tout d'abord, installer des bibliothèques tierces

jieba bibliothèque wordcloud et la bibliothèque est une excellente bibliothèque tierce, nous devons installer manuellement ces bibliothèques.

Ouvrez cmd, respectivement, entrez la commande, et pour installer la bibliothèque bibliothèque wordcloud jieba

pip installer jieba
pip installer wordcloud

En second lieu, l'article analyse l'utilisation de la bibliothèque de jieba

Ici, je sélectionne un écrivain qian article « chemin vers la plus grande résistance à la », à compter de la fréquence dans laquelle apparaissent les mots

Code est la suivante:

importation jieba 
txt = open ( "C: \\ text.txt", "r" codant pour 'utf-8' =) read (). 
mots = jieba.lcut (txt) 
compte = {} 
pour mot dans les mots: 
    si len (mot) == 1: 
        continuer le 
    reste: 
        comtes [mot] = counts.get (mot, 0) + 1 
articles = liste (counts.items ()) 
Items.Sort (key = lambda x: x [1], inverse = True) 
pour i dans la plage (15): 
    mot, count = articles [i] 
    print ( "{0: <10} {1:> 5}". Format (mot, nombre))

 La sortie est la suivante:

 

 Visible dans cet article, avant que les mots de la fréquence des mots 15, comme le montre la figure.

Troisièmement, l'utilisation de la bibliothèque wordcloud

bibliothèque jieba peut txt les statistiques de fréquence mot sortent, et nous voulons que le format de sortie en fonction. Mais ces mots forment le mot bibliothèques wordcloud nuage peut et peut sortir le mode d'image.

Ici, je choisis toujours l'article ci-dessus pour former une bibliothèque wordcloud nuage de mot.

Code est la suivante:

# GovRptWordCloudv1.py 
import jieba 
import wordcloud 
f = open ( "C: \\ text.txt", "r", encoding = "utf-8") 
 
t = f.read () 
f.close () 
ls = jieba. LCUT (t) 
 
txt = "" .join (ls) 
w = wordcloud.WordCloud (\ 
    width = 1000, hauteur = 700, \ 
    background_color = "blanc", 
    chemin_police = "msyh.ttc"     
    ) 
w.generate (txt) 
w .to_file ( "grwordcloud.png")

 nuage Word comme indiqué ci-dessous:

 

Je suppose que tu aimes

Origine www.cnblogs.com/lulingboke/p/12657510.html
conseillé
Classement