Usos do modelo de pré-treinamento Transformers: tradução Tradução - Code World

Usos do modelo de pré-treinamento Transformers: tradução Tradução

Enterprise 2023-08-13 01:59:39 views: null

A tradução é a tarefa de converter um texto de um idioma em um texto de outro idioma.

Um conjunto de dados mais clássico para tarefas de tradução é o conjunto de dados WMT de inglês para alemão, que usa o inglês como entrada e corresponde ao alemão como saída (também pode ser revertido quando você mesmo o usa).

usar pipeline

Ele pode ser implementado rapidamente com o seguinte código:

from transformers import pipeline

translator = pipeline("translation_en_to_de")
print(translator("Hugging Face is a technology company based in New York and Paris", max_length=40))

resultado da operação:

[{
    
    'translation_text': 'Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.'}]

Como o pipeline de tradução PreTrainedModel.generate()depende do método, podemos max_lengthsubstituir o método padrão conforme acima.

Usando modelos e tokenizadores de texto

As etapas específicas são as seguintes:

Instancie um tokenizador e modelo de texto. Uso geral BERTou T5modelo.
Defina um texto a ser traduzido.
Adicione T5o prefixo especial para a tradução translate English to German:.
Use PreTrainedModel.generate()o método para traduzir.

Código de amostra:

cache_dir="./transformersModels/summarization"
"""
,cache_dir = cache_dir
"""
from transformers import AutoModelWithLMHead, AutoTokenizer

model = AutoModelWithLMHead.from_pretrained("t5-base",cache_dir = cache_dir, return_dict=True)
tokenizer = AutoTokenizer.from_pretrained("t5-base",cache_dir = cache_dir)

inputs = tokenizer.encode("translate English to German: Hugging Face is a technology company based in New York and Paris", return_tensors="pt")
outputs = model.generate(inputs, max_length=40, num_beams=4, early_stopping=True)
print(tokenizer.decode(outputs[0]))

resultado da operação:

Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.

Consistente com os resultados do pipeline.

Acho que você gosta

Origin blog.csdn.net/qq_42464569/article/details/122411386

Usos do modelo de pré-treinamento Transformers: tradução Tradução

O modelo de pré-treinamento do Transformers usa: Resumo de resumo de texto

Literatura de leitura 1: Bootstrapping ViTs: Towards Liberating Vision Transformers from Pre-training (tradução do artigo e seu próprio entendimento e resumo)

O modelo de pré-treinamento dos Transformers usa: Classificação de Sequência Classificação de Sequência

[Tradução] Microsoft SAR - Notas práticas do sistema de recomendação

Imagem modelo de tradução --pix2pix

Ferramenta de tradução de marcação de palavras do Linux (tradução da versão web youdao)

Tradução de acompanhamento de texto completo do Flink 1.10

Interface de API de tradução do Google PHP

Introdução aos dois tipos de arquivo do modelo de pré-treinamento Tensorflow ckpt e pb

Plugin de tradução IDE definir tipo de tradução

Linux Software de tradução

VoxelNet tradução de artigos

[Tradução] Nx modelo mental (Mental Model)

Tradução gráfica online - tradução de texto

PNL - tradução automática de tradução

YOLOv1 Tradução chinesa (tradução de frases)

Tradução de documentos oficiais CUDA10.0 e modelo de programação de aprendizagem

O modelo personalizado (modificado) em Pytorch carrega a parte necessária dos parâmetros do modelo de pré-treinamento e congela

Tradução do documento oficial do Alertmanager

Crawler 018_urllib biblioteca_cookie anti-crawling_post solicita tradução do Baidu para obter conteúdo de tradução percentual_e conteúdo de tradução detalhado --- notas de trabalho do python 037

Tradução do Phoenix Explain Plan

tradução do guia oficial axios

Modelo de classificação de imagem prática de treinamento prático baseado em zero baseado no escopo do modelo da Dharma Academy

Projeto Prático de Processamento de Linguagem Natural 13 - Todo o Processo de Treinamento do Modelo de Extração de Palavras-chave Baseado no Modelo GRU e NER

Falsificação de formulário de tradução No.6 do Youdao

Solução de falha do plug-in de tradução da Idea Translation

manual do usuário Palabos tradução e aprendizagem (a) o tipo de dados subjacente

Use o módulo de solicitações para rastrear a tradução do Baidu

Guia de uso do pm4py (tradução não automática)

Recomendado

Clasificación

Diario

Más

2024-05-26(0)

2024-05-25(0)

2024-05-24(11)

2024-05-23(35)

2024-05-22(9)

2024-05-21(34)

2024-05-20(5)

2024-05-19(0)

2024-05-18(32)

2024-05-17(5)