NLP (1) Utilice jieba, pyltp, pkuseg, segmentación de palabras nltk - Code World

NLP (1) Utilice jieba, pyltp, pkuseg, segmentación de palabras nltk

Others 2021-03-03 07:46:17 views: null

Este artículo presentará lo siguiente:

Usar participio jieba
Utilice la segmentación de palabras de pyltp
Utilice pkuseg para segmentar palabras
Usar participio nltk

Normalmente, la PNL no puede procesar párrafos u oraciones completos a la vez, por lo que el primer paso suele ser la segmentación de oraciones y palabras. Aquí presentaremos varios métodos de segmentación de palabras.

Uno, use la segmentación de palabras jieba

Puede consultar el artículo que escribí antes: https://blog.csdn.net/TFATS/article/details/108810284

En segundo lugar, use la segmentación de palabras pyltp

Puede consultar el artículo que escribí antes: https://blog.csdn.net/TFATS/article/details/108511408

En tercer lugar, utilice la segmentación de palabras pkuseg

Puede consultar el artículo que escribí antes: https://blog.csdn.net/TFATS/article/details/108851344

Cuarto, use el participio nltk

La herramienta nltk se usa generalmente como una herramienta de incrustación de palabras en texto en inglés. Aquí solo se introduce el
método de tokenización . Para obtener información detallada sobre el uso, consulte: https://www.cnblogs.com/chen8023miss/p/11458571.html
http://www.pythontip.com/blog/post/10012/

Nota: Puede haber algunos problemas al instalar nltk, puede consultar el artículo que compartí antes: https://blog.csdn.net/TFATS/article/details/108519904

from nltk import word_tokenize

sent1 = "I love sky, I love sea."
sent2 = "I like running, I love reading."

sents = [sent1, sent2]
texts = [[word for word in word_tokenize(sent)] for sent in sents]

# ------ output------
[['I', 'love', 'sky', ',', 'I', 'love', 'sea', '.'], ['I', 'like', 'running', ',', 'I', 'love', 'reading', '.']]

Supongo que te gusta

Origin blog.csdn.net/TFATS/article/details/108800919

NLP (1) Utilice jieba, pyltp, pkuseg, segmentación de palabras nltk

NLP (1) Используйте сегментацию слов jieba, pyltp, pkuseg, nltk

NLP (1) Use jieba, pyltp, pkuseg, nltk word segmentation

NLP (1) Verwenden Sie die Wortsegmentierung jieba, pyltp, pkuseg, nltk

Mejora de la precisión de la segmentación de palabras de Jieba: utilice el modo paleta para la segmentación de palabras (utilice el modelo de aprendizaje profundo Baidu Flying Paddle para la segmentación de palabras)

Uso simple de la segmentación de palabras Python jieba

Segmentación de palabras de PNL-Jieba

segmentación de palabras jieba para extraer nombres nuevos

NLP (1) jieba, pyltp, pkuseg, nltk 단어 분할 사용

Punch NLP, algoritmos de segmentación de palabras de uso común en la práctica

Segmentación de palabras chinas y etiquetado de partes gramaticales para procesamiento de lenguaje natural NLP

已解决Palabras vacías de recursos no encontradas. Utilice NLTK Downloader para obtener el recurso:

[NLP] Método de tokenización común (segmentación de palabras): codificación de pares de bytes (BPE)

[Caso práctico de la red neuronal Pytorch] 39 segmentación de palabras de la biblioteca jieba + vector de palabras chino de entrenamiento

Análisis de texto Python (NLTK, jieba, snownlp)

NLP（1）jieba、pyltp、pkuseg、nltkの単語セグメンテーションを使用する

Filtro de segmentación de palabras TFIDF, extraer palabras clave

herramienta de segmentación de corriente a jieba encabezado Resumen

rdkit & nlp | Incrustación de palabras para sonrisas químicas

Java combina la biblioteca de segmentación de palabras chinas jieba para contar el número de apariciones de cada palabra en un conjunto de texto [registro de código]

Ejercicios básicos de Python: demuestre el efecto de segmentación de palabras de la biblioteca jieba (biblioteca de fecha y hora, lectura y escritura de archivos, intente excepto, formateo de cadenas de salida, procesamiento de EOF)

Segmentación de palabras del diccionario de aprendizaje de HanLP

herramienta de segmentación de palabras php china

Segmentación de palabras para reseñas de hoteles

Tutorial de Elasticsearch: segmentación de palabras personalizada ik

Métodos comunes de segmentación de palabras

Elasticsearch admite la segmentación de palabras en chino

HMM, Viterbi y segmentación de palabras chinas

Utilice keras para la segmentación de imágenes

[ES desde la entrada al combate real] 21. Búsqueda de texto completo-ElasticSearch-segmentación de palabras-segmentación de palabras e instalación de segmentación de palabras ik

Recomendado

Clasificación

Diario

Más

2024-05-16(22)

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)

2024-05-08(18)

2024-05-07(35)