Usos del modelo de pre-entrenamiento de transformadores: traducción Traducción - Code World

Usos del modelo de pre-entrenamiento de transformadores: traducción Traducción

Enterprise 2023-08-13 01:59:35 views: null

La traducción es la tarea de convertir el texto en un idioma en texto en otro idioma.

Un conjunto de datos más clásico para tareas de traducción es el conjunto de datos WMT de inglés a alemán, que toma el inglés como entrada y corresponde al alemán como salida (también se puede invertir cuando lo usa usted mismo).

usar canalización

Se puede implementar rápidamente con el siguiente código:

from transformers import pipeline

translator = pipeline("translation_en_to_de")
print(translator("Hugging Face is a technology company based in New York and Paris", max_length=40))

resultado de la operación:

[{
    
    'translation_text': 'Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.'}]

Dado que la tubería de traducción PreTrainedModel.generate()depende del método, podemos max_lengthanular el método predeterminado como se indicó anteriormente.

Uso de modelos y tokenizadores de texto

Los pasos específicos son los siguientes:

Cree una instancia de un tokenizador de texto y un modelo. Uso general BERTo T5modelo.
Definir un texto a traducir.
Agregue T5el prefijo especial para la traducción translate English to German:.
Usa PreTrainedModel.generate()el método para traducir.

Código de muestra:

cache_dir="./transformersModels/summarization"
"""
,cache_dir = cache_dir
"""
from transformers import AutoModelWithLMHead, AutoTokenizer

model = AutoModelWithLMHead.from_pretrained("t5-base",cache_dir = cache_dir, return_dict=True)
tokenizer = AutoTokenizer.from_pretrained("t5-base",cache_dir = cache_dir)

inputs = tokenizer.encode("translate English to German: Hugging Face is a technology company based in New York and Paris", return_tensors="pt")
outputs = model.generate(inputs, max_length=40, num_beams=4, early_stopping=True)
print(tokenizer.decode(outputs[0]))

resultado de la operación:

Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.

De acuerdo con los resultados de la canalización.

Supongo que te gusta

Origin blog.csdn.net/qq_42464569/article/details/122411386

Usos del modelo de pre-entrenamiento de transformadores: traducción Traducción

Usos del modelo de pre-entrenamiento de transformadores: Clasificación de secuencia Clasificación de secuencia

【】论文笔记 BERT: Pre-entrenamiento de profunda bidireccionales Transformadores para la comprensión del lenguaje

ViLBERT: modelo de pre-entrenamiento para tareas de visión-lenguaje

Activación de la era RPA, Microsoft dio a conocer un documento común para entender el pre-entrenamiento del modelo LayoutLM

Emergencia del modelo de lenguaje grande LLM Emergencia retroalimentación refuerzo aprendizaje RLHF pre-entrenamiento token word incrustaciones temperatura temperatura = 0.7

[Traducción] Modelo de objeto Qt

China pre-entrenamiento del modelo ERNIE2.0 modelo de descargar e instalar

De la entrada a la competencia: flujo de trabajo y aplicación práctica del transformador de pre-entrenamiento generativo

Combate real de PNL: extracción de información de orden expresa - basado en el modelo de pre-entrenamiento ERNIE1.0

Imagen modelo de traducción --pix2pix

Mecanismo de atención (5): principios e implementación de la arquitectura de transformadores, traducción automática real

Linux Software de traducción

traducción de caracteres MarkDown

Traducción de documentos AbstractQueuedSynchronizer

Modelo de programación de aprendizaje y traducción de documentos oficiales CUDA10.0

Descripción general de los modelos de pre-entrenamiento de PNL: de word2vec, ELMo a BERT

¿Hay muy pocos datos del corpus de traducción automática? Los titulares de hoy y Nantah proponen un modelo NMT basado en la duplicación

NeXtVLAD volar salsa de modelo de prueba de pre-entrenamiento

Modelo de pre-entrenamiento de imagen médica 3D de MedicalNet

Traducción de documentos oficiales de Alertmanager

NAT: traducción de direcciones de red

Solución de falla del complemento de traducción de Idea Translation

[Procesamiento del lenguaje natural] [Modelo grande] Introducción a la multiplicación de matrices de 8 bits para transformadores grandes

plug-in de IDEA traducción instalada

traducción de texto Tarea 6 Kittenblock

La traducción de la red

1136: Traducción de contraseña (C C ++)

Traducción de contraseña T1110

CariGANs: traducción de foto a caricatura no emparejada

Recomendado

Clasificación

Diario

Más

2024-05-17(4)

2024-05-16(22)

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)

2024-05-08(18)