Transformers预训练模型使用：翻译 Translation - 代码天地

Transformers预训练模型使用：翻译 Translation

企业开发 2023-08-12 21:32:45 阅读次数: 0

翻译是将一个语言的文本转化为另一个语言文本的任务。

翻译任务的一个比较经典的数据集是WMT English to German dataset，将英语作为输入，对应德语作为输出（自己用的时候也可以反过来）。

使用pipeline

可以使用如下代码快速实现：

from transformers import pipeline

translator = pipeline("translation_en_to_de")
print(translator("Hugging Face is a technology company based in New York and Paris", max_length=40))

运行结果：

[{
    
    'translation_text': 'Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.'}]

由于翻译的pipeline依赖于PreTrainedModel.generate()方法，因此我们可以像上面的max_length一样覆盖默认的方法。

使用模型和文本标记器

具体步骤如下：

实例化文本标记器和模型。一般使用BERT或T5模型。
定义一个需要翻译的文本。
加上T5翻译的特殊前缀translate English to German:。
使用PreTrainedModel.generate()方法进行翻译。

示例代码：

cache_dir="./transformersModels/summarization"
"""
,cache_dir = cache_dir
"""
from transformers import AutoModelWithLMHead, AutoTokenizer

model = AutoModelWithLMHead.from_pretrained("t5-base",cache_dir = cache_dir, return_dict=True)
tokenizer = AutoTokenizer.from_pretrained("t5-base",cache_dir = cache_dir)

inputs = tokenizer.encode("translate English to German: Hugging Face is a technology company based in New York and Paris", return_tensors="pt")
outputs = model.generate(inputs, max_length=40, num_beams=4, early_stopping=True)
print(tokenizer.decode(outputs[0]))

运行结果：

Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.

与pipeline结果一致。

猜你喜欢

转载自blog.csdn.net/qq_42464569/article/details/122411386

Transformers预训练模型使用：翻译 Translation

idea翻译插件translation

[Pycharm插件] 翻译 | Translation

A - Translation

translation

【机器翻译machine translation】

Idea安装翻译插件Translation

NLP——Translation 机器翻译

pycharm实现翻译功能（Translation）

Android Studio 翻译插件Translation的安装使用

android studio翻译插件Translation使用。。

IntelliJ Translation 翻译插件安装与使用

关于jetBrains的插件translation的使用

机器翻译（machine translation）相关

idea 插件推荐 Translation(翻译插件)

INCORPORATING BERT INTO NEURAL MACHINE TRANSLATION翻译

Explicit Sentence Compression for Neural Machine Translation翻译

pycharm等IDE中的翻译插件——translation

Android Studio翻译插件推介（Translation）

AndroidStudio中添加翻译插件：Translation

分享一个idea翻译插件Translation的安装及使用

JETBRAINS开发工具中Translation翻译插件的使用

Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation翻译

Tied Transformers: Neural Machine Translation with Shared Encoder and Decoder

机器翻译 | 反向翻译 (back-translation) 笔记

IDEA插件推荐 - 翻译Translation,log高亮Grep Console

全文翻译&杂记《Image-to-Image Translation with Conditional Adversarial NetWorks》

IDEA比较实用的插件之翻译插件（Translation）

Science page: AI,Explain Yourself translation COMMUNICATION OF THE ACM翻译

Science page: AI,Explain Yourself translation COMMUNICATION OF THE ACM翻译

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)