Python procesamiento del lenguaje natural a sólo 5 líneas de código

Python procesamiento del lenguaje natural a sólo 5 líneas de código

I. Introducción

La inteligencia artificial es una de las principales aplicaciones del lenguaje popular Python, y el procesamiento del lenguaje natural y la inteligencia artificial en una dirección general. el procesamiento del lenguaje natural (procesamiento del lenguaje natural) se refiere PNL, lenguaje natural es un método de comunicación entre un estudio realizado por el mismo equipo. Todos sabemos, solo sabemos 0 y 1 en un equipo que la naturaleza, pero podemos utilizar un lenguaje de programación lenguaje de programación con la comunicación del ordenador. Esta es, de hecho, el programador con la comunicación entre ordenadores, y nuestra vida cotidiana utilizando lenguaje natural, es un lenguaje de la emoción. Entonces, ¿cómo hacer que las computadoras entienden el lenguaje de la emoción con ella? Este es el contenido de la investigación de procesamiento de lenguaje natural.

idioma de reconocimiento de la emoción es una operación de procesamiento del lenguaje natural, si queremos lograr con el reconocimiento de emociones cero es más complicado. Lo primero que necesitamos para preparar los datos suficientes para hacer que las computadoras mejor comprensión, también tenemos que preprocesar los datos, entonces requerimos datos de entrenamiento con datos de entrenamiento que podemos empezar a identificar las emociones. la precisión del reconocimiento y la cantidad de datos por los datos asociados, los datos relacionados con la más alta, mayor es la cantidad de datos, la precisión de reconocimiento será mayor.

Sin embargo, podemos alcanzar rápidamente usando el reconocimiento paddlehub emoción, nos fijamos en cómo instalar.

En segundo lugar, la instalación paddlehub

paddlehub es un modelo de Baidu biblioteca vuelan PaddlePaddle remo, el uso paddlepaddle puede alcanzar rápidamente una variedad de operaciones en las que tenemos que decir hoy el reconocimiento de caracteres emoción, y el código es muy simple. Primero necesitamos instalar paddlepaddle, entramos en el sitio web oficial https://www.paddlepaddle.org.cn/install/quick después de entrar en el sitio web oficial se puede ver la siguiente interfaz:

Aquí Insertar imagen Descripción

Podemos según su propia versión de Python, sistemas informáticos y otra de instalación seleccionado. Acerca de las versiones paddlepaddle apoyado y otra información se puede ver en el sitio web oficial, no entrar aquí. Estoy usando Python3.7, uso directo PIP instalar aquí, emitimos la siguiente consola de declaraciones

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

Luego ver si la instalación se ha realizado correctamente en la consola. Para entrar Python, y luego realizar import paddle.fluid, a continuación, ejecutar paddle.fluid.install_check.run_check()la siguiente:

C:\Users\zaxwz>python
Python 3.7.6 (tags/v3.7.6:43364a7ae0, Dec 19 2019, 00:42:30) [MSC v.1916 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import paddle.fluid
>>> paddle.fluid.install_check.run_check()

Si la pantalla Your Paddle is installed successfully! Let's start deep Learning with Paddle nowdice que la instalación se ha realizado correctamente. Además, también es necesario instalar paddlehub, aquí también es utilizar PIP instalar, ejecute la siguiente instrucción:

pip install -i https://mirror.baidu.com/pypi/simple paddlehub

Después de la exitosa paddlepaddle paddlehub instalación y podemos empezar a escribir código.

En tercer lugar, el reconocimiento de emociones

(1) el reconocimiento de emociones

el reconocimiento de emociones paso utilizando paddlehub completa como sigue:

  1. módulo de importación
  2. Cargar modelo
  3. preparación frase
  4. emocional

La finalización de los pasos anteriores necesitan sólo cuatro líneas de código, y tenemos que mirar a la salida del resultado del reconocimiento, es un total de cinco líneas de código, vamos a echar un vistazo a estos cinco código mágico:

# 导入模块
import paddlehub as hub
# 加载模型
senta = hub.Module(name='senta_lstm')
# 准备句子
sentence = ['你真美']
# 情绪识别
result = senta.sentiment_classify(data={"text":sentence})
# 输出识别结果
print(result)

Los resultados del reconocimiento son los siguientes:

[{'text': '你真美', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9602, 'negative_probs': 0.0398}]

Podemos ver una lista de tipos de oraciones se preparan, el resultado es la identificación de una lista de tipos, elementos de la lista es el resultado de un diccionario. En la lista del diccionario, que contiene los resultados de nuestro reconocimiento. Vamos a analizar este diccionario.

(2) los resultados del análisis

El diccionario contiene cuatro campos resultados nos muestran en forma de tabla:

Nombre del campo campo Significado explicación
texto texto fuente identificada texto fuente identificada
sentiment_label Clasificación y Etiquetado 1 es positivo, 0 negativo
sentiment_key resultados de la clasificación positivo a positivo y negativo a negativo
positive_probs tasa positiva Es el estado de ánimo posibilidades positivas
negative_probs tasa negativa sentimiento negativo para la posibilidad de

La tabla anterior es mi serie, un término equivocado en más lugares perdonarme. Tenemos el control de la tabla anterior podemos analizar los resultados del programa. La implicación es que la frase "Eres hermosa" contiene las emociones positivas. Nos fijamos en algunos ejemplos más:

import paddlehub as hub

senta = hub.Module(name='senta_lstm')

sentence = [
    '你真美',
    '你真丑',
    '我好难过',
    '我不开心',
    '这个游戏好好玩',
    '什么垃圾游戏',
]

results = senta.sentiment_classify(data={"text":sentence})

for result in results:
    print(result)

Los resultados del reconocimiento son los siguientes:

{'text': '你真美', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9602, 'negative_probs': 0.0398}
{'text': '你真丑', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0033, 'negative_probs': 0.9967}
{'text': '我好难过', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.5324, 'negative_probs': 0.4676}
{'text': '我不开心', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.1936, 'negative_probs': 0.8064}
{'text': '这个游戏好好玩', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9933, 'negative_probs': 0.0067}
{'text': '什么垃圾游戏', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0108, 'negative_probs': 0.9892}

Hay más de seis frases, la mayoría de ellos identificado con éxito la emoción, pero el 我好难过resultado del reconocimiento es positivo, es obviamente erróneo. En general, para una simple declaración de reconocimiento es bastante precisa. Además, si la precisión de la identificación de descontento, podemos formar a sus propios conjuntos de datos. Para más detalles, consulte la dirección del proyecto https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/sentiment_classification .

También en el camino aquí para darle bienestar puntos libre:

Aquí Insertar imagen Descripción

Jaja, has oído difícil obligar tengo el asistente.

Publicado 33 artículos originales · ganado elogios 4153 · Vistas de 260.000 +

Supongo que te gusta

Origin blog.csdn.net/ZackSock/article/details/105057106
Recomendado
Clasificación