Python uso de la biblioteca jieba y el uso de la nube de palabras

En primer lugar, instale las bibliotecas de terceros

biblioteca wordcloud jieba y la biblioteca es una biblioteca excelente de terceros, tenemos que instalar manualmente estas bibliotecas.

cmd abiertas, respectivamente, entre el mandato, y para instalar la biblioteca del wordcloud jieba biblioteca

pip instalar jieba
pip instalar wordcloud

En segundo lugar, el artículo analiza el uso de la biblioteca jieba

Aquí selecciono un artículo "camino hacia la mayor resistencia al" escritor Qian, para contar la frecuencia de aparición de las palabras

Código es el siguiente:

jieba importación 
txt = abierto ( "C: \\ text.txt", "r", que codifica = 'utf-8') leer (). 
palabras = jieba.lcut (TXT) 
recuentos = {} 
para la palabra en palabras: 
    si len (palabra) == 1: 
        continuar 
    más: 
        recuentos [palabra] = counts.get (palabra, 0) + 1 
artículos = lista (counts.items ()) 
Items.Sort (clave = lambda x: x [1], revertir = True) 
for i in range (15): 
    palabra, cuente = artículos [i] 
    de impresión ( "{0: <10} {1:> 5}". formato (Word, recuento))

 La salida es la siguiente:

 

 Visible en este artículo, antes de las palabras de frecuencia de palabras 15, como se muestra en la figura.

En tercer lugar, el uso de la biblioteca de wordcloud

jieba biblioteca puede txt la palabra estadísticas de frecuencia salen, y queremos que el formato de salida de acuerdo a. Pero estas palabras forman la palabra nube wordcloud bibliotecas pueden y puede hacer salir el modo de imagen.

Aquí todavía quiero el artículo anterior para formar una biblioteca de nube de palabras wordcloud.

Código es el siguiente:

# GovRptWordCloudv1.py 
jieba importación 
wordcloud importación 
f = open ( "C: \\ text.txt", "r", encoding = "UTF-8") 
 
t = f.read () 
f.close () 
ls = jieba. LCUT (t) 
 
txt = "" .join (LS) 
w = wordcloud.WordCloud (\ 
    width = 1,000, altura = 700, \ 
    background_color = "blanco", 
    font_path = "msyh.ttc"     
    ) 
w.generate (txt) 
w .to_file ( "grwordcloud.png")

 Palabra nube como se muestra a continuación:

 

Supongo que te gusta

Origin www.cnblogs.com/lulingboke/p/12657510.html
Recomendado
Clasificación