tutorial de instalación pyhanlp

1, Perfil hanlp

HanLP se compone de una serie de modelos y algoritmos objetivos del kit de herramientas Java para popularizar la aplicación de procesamiento de lenguaje natural en un entorno de producción. HanLP con rasgos perfectos, eficiencia, rendimiento estructura clara, cuando los nuevos corpus, características personalizables.

Hanlp tiene las siguientes características:

  • palabra china
  • etiquetado del habla
  • entidad denominada reconocimiento
  • análisis de dependencias
  • la extracción de palabras clave descubrir nuevas palabras
  • extracción de la frase
  • Resumen automática
  • Categorización de texto
  • Simplificado y tradicional Pinyin

2, la instalación hanlp

Paso: pyhanlp introduzca el siguiente código (ctrl + r, introduzca cmd), la biblioteca se puede instalar: hanlp Proporcionando módulos de biblioteca pitón, las necesidades del sistema a cuadro de comando

pip instalar pyhanlp

Paso dos: la biblioteca hanlp dependencias de paquetes, por lo que con éxito el uso también es necesario para descargar los paquetes de datos específicos, los paquetes deben tener: data-for-1.7.7.zip (última edición),

Descargar los datos: https://github.com/hankcs/HanLP/releases

Una vez descargado, el archivo en el directorio, de acuerdo con el directorio donde se instala el compilador pitón puede ser, como mi directorio es: E: \ herramienta \ Python \ Lib \ site-packages \ pyhanlp \ estática, no puede encontrar su camino en el cuadro de mando de nuevo para volver a entrar en el comando de instalación, se puede. Nota Una vez que haya descargado el paquete de datos, sin descompresión, directamente en su directorio. Escriba el siguiente código:

Pitón de importación *

 Ejecutar, puede extraer de forma automática, después de un exitoso comienzo de la prueba.

3, prueba de función hanlp

Introducir el código de prueba simple, hanlp prueba cuenta con:

de pyhanlp importación * 

frase = " Me gusta ser un escritor, escribir el tipo de libro a su escritor favorito, la escritura permite que el escritor del libro muchos lectores parecen incapaces de parada, escribir el tipo de escritor abundantes libro " 

Términos = HanLP .SEGMENT (frase)
 Imprimir (Términos)

Los resultados muestran:

Salida: [I / rr, como / VI, cuando / p, a / q, escritor / NNT ,, / w, clasificar / r, escritura / v, propia / rr, reloj / v, a / ude1, libro / n, la / ude1, escritor / NNT ,, / w, escritura / v, se puede / v, sea / v, lote / m, el lector / n, parece / v, incapaz de detener / vl, el / ude1, libro / n, la / ude1, escritor / NNT ,, / w, de escritura / v, que / r, abundante / al, el / ude1, libros / n, el / ude1, escritor / NNT]

4, documentación de referencia hanlp

documentación de referencia pyhanlp: https://github.com/hankcs/pyhanlp

documentación de referencia hanlp: https://github.com/hankcs/HanLP/blob/master/README.md

5 Notas

pynlp y hanlp son la segmentación de hanlp, herramienta de etiquetado POS, HanLP es un conjunto de herramientas de Java se basa en la caja de herramientas pitón pitón, si se compila con el pitón PyCharm, instale suficiente pyhanlp.

Supongo que te gusta

Origin www.cnblogs.com/maxxu11/p/12594387.html
Recomendado
Clasificación