En primer lugar, instale las bibliotecas de terceros
biblioteca wordcloud jieba y la biblioteca es una biblioteca excelente de terceros, tenemos que instalar manualmente estas bibliotecas.
cmd abiertas, respectivamente, entre el mandato, y para instalar la biblioteca del wordcloud jieba biblioteca
pip instalar jieba
pip instalar wordcloud
En segundo lugar, el artículo analiza el uso de la biblioteca jieba
Aquí selecciono un artículo "camino hacia la mayor resistencia al" escritor Qian, para contar la frecuencia de aparición de las palabras
Código es el siguiente:
jieba importación txt = abierto ( "C: \\ text.txt", "r", que codifica = 'utf-8') leer (). palabras = jieba.lcut (TXT) recuentos = {} para la palabra en palabras: si len (palabra) == 1: continuar más: recuentos [palabra] = counts.get (palabra, 0) + 1 artículos = lista (counts.items ()) Items.Sort (clave = lambda x: x [1], revertir = True) for i in range (15): palabra, cuente = artículos [i] de impresión ( "{0: <10} {1:> 5}". formato (Word, recuento))
La salida es la siguiente:
Visible en este artículo, antes de las palabras de frecuencia de palabras 15, como se muestra en la figura.
En tercer lugar, el uso de la biblioteca de wordcloud
jieba biblioteca puede txt la palabra estadísticas de frecuencia salen, y queremos que el formato de salida de acuerdo a. Pero estas palabras forman la palabra nube wordcloud bibliotecas pueden y puede hacer salir el modo de imagen.
Aquí todavía quiero el artículo anterior para formar una biblioteca de nube de palabras wordcloud.
Código es el siguiente:
# GovRptWordCloudv1.py jieba importación wordcloud importación f = open ( "C: \\ text.txt", "r", encoding = "UTF-8") t = f.read () f.close () ls = jieba. LCUT (t) txt = "" .join (LS) w = wordcloud.WordCloud (\ width = 1,000, altura = 700, \ background_color = "blanco", font_path = "msyh.ttc" ) w.generate (txt) w .to_file ( "grwordcloud.png")
Palabra nube como se muestra a continuación: