Python procesamiento del lenguaje natural a sólo 5 líneas de código
I. Introducción
La inteligencia artificial es una de las principales aplicaciones del lenguaje popular Python, y el procesamiento del lenguaje natural y la inteligencia artificial en una dirección general. el procesamiento del lenguaje natural (procesamiento del lenguaje natural) se refiere PNL, lenguaje natural es un método de comunicación entre un estudio realizado por el mismo equipo. Todos sabemos, solo sabemos 0 y 1 en un equipo que la naturaleza, pero podemos utilizar un lenguaje de programación lenguaje de programación con la comunicación del ordenador. Esta es, de hecho, el programador con la comunicación entre ordenadores, y nuestra vida cotidiana utilizando lenguaje natural, es un lenguaje de la emoción. Entonces, ¿cómo hacer que las computadoras entienden el lenguaje de la emoción con ella? Este es el contenido de la investigación de procesamiento de lenguaje natural.
idioma de reconocimiento de la emoción es una operación de procesamiento del lenguaje natural, si queremos lograr con el reconocimiento de emociones cero es más complicado. Lo primero que necesitamos para preparar los datos suficientes para hacer que las computadoras mejor comprensión, también tenemos que preprocesar los datos, entonces requerimos datos de entrenamiento con datos de entrenamiento que podemos empezar a identificar las emociones. la precisión del reconocimiento y la cantidad de datos por los datos asociados, los datos relacionados con la más alta, mayor es la cantidad de datos, la precisión de reconocimiento será mayor.
Sin embargo, podemos alcanzar rápidamente usando el reconocimiento paddlehub emoción, nos fijamos en cómo instalar.
En segundo lugar, la instalación paddlehub
paddlehub es un modelo de Baidu biblioteca vuelan PaddlePaddle remo, el uso paddlepaddle puede alcanzar rápidamente una variedad de operaciones en las que tenemos que decir hoy el reconocimiento de caracteres emoción, y el código es muy simple. Primero necesitamos instalar paddlepaddle, entramos en el sitio web oficial https://www.paddlepaddle.org.cn/install/quick después de entrar en el sitio web oficial se puede ver la siguiente interfaz:
Podemos según su propia versión de Python, sistemas informáticos y otra de instalación seleccionado. Acerca de las versiones paddlepaddle apoyado y otra información se puede ver en el sitio web oficial, no entrar aquí. Estoy usando Python3.7, uso directo PIP instalar aquí, emitimos la siguiente consola de declaraciones
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
Luego ver si la instalación se ha realizado correctamente en la consola. Para entrar Python
, y luego realizar import paddle.fluid
, a continuación, ejecutar paddle.fluid.install_check.run_check()
la siguiente:
C:\Users\zaxwz>python
Python 3.7.6 (tags/v3.7.6:43364a7ae0, Dec 19 2019, 00:42:30) [MSC v.1916 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import paddle.fluid
>>> paddle.fluid.install_check.run_check()
Si la pantalla Your Paddle is installed successfully! Let's start deep Learning with Paddle now
dice que la instalación se ha realizado correctamente. Además, también es necesario instalar paddlehub, aquí también es utilizar PIP instalar, ejecute la siguiente instrucción:
pip install -i https://mirror.baidu.com/pypi/simple paddlehub
Después de la exitosa paddlepaddle paddlehub instalación y podemos empezar a escribir código.
En tercer lugar, el reconocimiento de emociones
(1) el reconocimiento de emociones
el reconocimiento de emociones paso utilizando paddlehub completa como sigue:
- módulo de importación
- Cargar modelo
- preparación frase
- emocional
La finalización de los pasos anteriores necesitan sólo cuatro líneas de código, y tenemos que mirar a la salida del resultado del reconocimiento, es un total de cinco líneas de código, vamos a echar un vistazo a estos cinco código mágico:
# 导入模块
import paddlehub as hub
# 加载模型
senta = hub.Module(name='senta_lstm')
# 准备句子
sentence = ['你真美']
# 情绪识别
result = senta.sentiment_classify(data={"text":sentence})
# 输出识别结果
print(result)
Los resultados del reconocimiento son los siguientes:
[{'text': '你真美', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9602, 'negative_probs': 0.0398}]
Podemos ver una lista de tipos de oraciones se preparan, el resultado es la identificación de una lista de tipos, elementos de la lista es el resultado de un diccionario. En la lista del diccionario, que contiene los resultados de nuestro reconocimiento. Vamos a analizar este diccionario.
(2) los resultados del análisis
El diccionario contiene cuatro campos resultados nos muestran en forma de tabla:
Nombre del campo | campo Significado | explicación |
---|---|---|
texto | texto fuente identificada | texto fuente identificada |
sentiment_label | Clasificación y Etiquetado | 1 es positivo, 0 negativo |
sentiment_key | resultados de la clasificación | positivo a positivo y negativo a negativo |
positive_probs | tasa positiva | Es el estado de ánimo posibilidades positivas |
negative_probs | tasa negativa | sentimiento negativo para la posibilidad de |
La tabla anterior es mi serie, un término equivocado en más lugares perdonarme. Tenemos el control de la tabla anterior podemos analizar los resultados del programa. La implicación es que la frase "Eres hermosa" contiene las emociones positivas. Nos fijamos en algunos ejemplos más:
import paddlehub as hub
senta = hub.Module(name='senta_lstm')
sentence = [
'你真美',
'你真丑',
'我好难过',
'我不开心',
'这个游戏好好玩',
'什么垃圾游戏',
]
results = senta.sentiment_classify(data={"text":sentence})
for result in results:
print(result)
Los resultados del reconocimiento son los siguientes:
{'text': '你真美', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9602, 'negative_probs': 0.0398}
{'text': '你真丑', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0033, 'negative_probs': 0.9967}
{'text': '我好难过', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.5324, 'negative_probs': 0.4676}
{'text': '我不开心', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.1936, 'negative_probs': 0.8064}
{'text': '这个游戏好好玩', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9933, 'negative_probs': 0.0067}
{'text': '什么垃圾游戏', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0108, 'negative_probs': 0.9892}
Hay más de seis frases, la mayoría de ellos identificado con éxito la emoción, pero el 我好难过
resultado del reconocimiento es positivo, es obviamente erróneo. En general, para una simple declaración de reconocimiento es bastante precisa. Además, si la precisión de la identificación de descontento, podemos formar a sus propios conjuntos de datos. Para más detalles, consulte la dirección del proyecto https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/sentiment_classification .
También en el camino aquí para darle bienestar puntos libre:
Jaja, has oído difícil obligar tengo el asistente.