Tout d'abord, installer des bibliothèques tierces
jieba bibliothèque wordcloud et la bibliothèque est une excellente bibliothèque tierce, nous devons installer manuellement ces bibliothèques.
Ouvrez cmd, respectivement, entrez la commande, et pour installer la bibliothèque bibliothèque wordcloud jieba
pip installer jieba
pip installer wordcloud
En second lieu, l'article analyse l'utilisation de la bibliothèque de jieba
Ici, je sélectionne un écrivain qian article « chemin vers la plus grande résistance à la », à compter de la fréquence dans laquelle apparaissent les mots
Code est la suivante:
importation jieba txt = open ( "C: \\ text.txt", "r" codant pour 'utf-8' =) read (). mots = jieba.lcut (txt) compte = {} pour mot dans les mots: si len (mot) == 1: continuer le reste: comtes [mot] = counts.get (mot, 0) + 1 articles = liste (counts.items ()) Items.Sort (key = lambda x: x [1], inverse = True) pour i dans la plage (15): mot, count = articles [i] print ( "{0: <10} {1:> 5}". Format (mot, nombre))
La sortie est la suivante:
Visible dans cet article, avant que les mots de la fréquence des mots 15, comme le montre la figure.
Troisièmement, l'utilisation de la bibliothèque wordcloud
bibliothèque jieba peut txt les statistiques de fréquence mot sortent, et nous voulons que le format de sortie en fonction. Mais ces mots forment le mot bibliothèques wordcloud nuage peut et peut sortir le mode d'image.
Ici, je choisis toujours l'article ci-dessus pour former une bibliothèque wordcloud nuage de mot.
Code est la suivante:
# GovRptWordCloudv1.py import jieba import wordcloud f = open ( "C: \\ text.txt", "r", encoding = "utf-8") t = f.read () f.close () ls = jieba. LCUT (t) txt = "" .join (ls) w = wordcloud.WordCloud (\ width = 1000, hauteur = 700, \ background_color = "blanc", chemin_police = "msyh.ttc" ) w.generate (txt) w .to_file ( "grwordcloud.png")
nuage Word comme indiqué ci-dessous: