OmegaTの紹介

本明細書で使用される初心者OmegaTのを指します。単に用語集、辞書、機械翻訳、翻訳メモリまたは詳細のように、対応する例を含む、ソフトウェアの機能と原理を説明しています。
ベースのOmegaT 4.1.2

簡単な紹介

OmegaTのは、大幅翻訳の効率と品質を向上させることができ、コンピュータ支援翻訳(CAT)ツールであり、それは百度、そのような翻訳適切な方法トランスレータとして、翻訳結果を直接生成することができないようではありませんプロの翻訳者のためのOmegaT。その特徴は、辞書のインラインスペルチェック機能のスペル一致する翻訳メモリファジーマッチとスプレッド、用語ライブラリが一致し、辞書検索、および使用のマッチングとCenkaoziliaoのhunspellと正規表現カスタマイズ可能なセグメントの使用を含みます。

それも、プロユースのために、使用するすべての料金を支払うことなく、言うことですつまり、無料です;と長いユーザーライセンス契約の遵守などとして、あなたはそれを自由に変更することができ、(または)再リリース。

ワークス

各翻訳作業のために、OmegaTのは、指定したファイルのフォルダのコレクションが含まれているプロジェクトファイルを作成します。非翻訳ユーザー/ソース/サブフォルダこれに文書をコピーすると、翻訳の最後に、翻訳された文書は/ターゲット/サブフォルダに表示されます。OmegaTの編集ペインは、ユーザーの翻訳のためのソースドキュメントのセグメント化された翻訳可能なコンテンツのセクションに表示されています。

翻訳を開始する前に、ユーザはまた、へ/ TM /サブフォルダ以前の翻訳メモリをコピー用語集に/用語集/フォルダにコピーし、StarDictは辞書へ/辞書/フォルダをコピーすることができ、OmegaTのは自動的に翻訳でそれらを確認します。

翻訳すると、OmegaTのは、自動的に同様の文があいまいマッチングを発見した後のペインに表示されます見つけるために、過去の翻訳をチェックします。翻訳者は、編集ペインファジーマッチングに挿入するショートカットキーを使用することができます。OmegaTのも、以前に用語集と辞書プロジェクトフォルダに追加したユーザーを参照してください。機械翻訳が有効になっている場合は、Googleが翻訳のような、それは機械翻訳の別々のペインに表示されます。

翻訳後、OmegaTのは、翻訳されたファイルを作成し、これらのファイルを再利用してできるように、TMXファイルに現在の翻訳プロジェクトをエクスポート通訳または他の使用のOmegaT以降の翻訳で別のCATツール交換。

基本操作

ダウンロードしてインストール

OmegaTのは、から入手できるクロスプラットフォームの翻訳ソフトであり、公式ウェブサイトをダウンロードします。インストールは基本的にすべての方法であるNextことに。

インストール後に完全なインタフェースであります

新プロジェクト

プロジェクト - >新規 - >空のフォルダを選択します。OmegaTの翻訳プロジェクトは、ファイルやサブフォルダに必要なこのフォルダ機能で生成されます

新しいプロジェクトを作成します

新しいプロジェクトを作成するときは、デフォルトEN-> CNで、中国の環境をインストールした後、ソースとターゲット言語を指定する必要があります。通常の状況下では、変更する必要は选项あなたが変更する必要があれば、将来的にはいつでも変更することはできません。デフォルトのファイルの場所は、すべてで使用することができます。

翻訳するファイルに追加します。

プロジェクトを作成した後、デフォルトでは项目文件、ダイアログボックス、クリックし导入源文件、翻訳するファイルを追加します。

プロジェクトファイル

文書の翻訳

各セグメントOmegaTのあなたの翻訳を提示します。翻訳断片が押されたCtrl+U下断片に非翻訳(またはCtrl+Shift+U次のセグメントに移動が翻訳されています)。あなたは、翻訳の最終的な形を見たいときは、を押してCtrl+D翻訳されたドキュメントを生成し、彼らはプロジェクトフォルダ内にある/target/サブフォルダ。便利な様々な機能を実行することができ、[編集]メニューを使用して翻訳プロセスに入ります。

翻訳インタフェース

辞書を追加

OmegaTのはStarDictは辞書やLingvo DSL形式をサポートしています。Baiduの「StarDictは」辞書をにダウンロードすることができます検索し.gz、他の圧縮形式、解凍、辞書データが得られる(通常は3つのファイルが含まれているdzidxifo)、使用することができ、中に「辞書」フォルダのプロジェクトにファイルをコピーしますアクセシビリティ辞書。

辞書を使用してください

使用時には、我々は、形式または辞書自体は缶の理由であってもよい、いくつかの辞書ファイルの何の効果は認められませんでした。

翻訳メモリ

プロジェクトOmegaTの翻訳メモリファイルのTMXファイルの拡張子。これは、5つの場所に共存します。

  1. プロジェクトomegat 文件夹project_save.tmxファイル。これは、当初からプロジェクトから保存されたすべてのクリップが含まれています。
  2. 项目主文件夹中包含 3 个 tmx 文件:project_name-omegat.tmxproject_name-level1.tmx 以及 project_name-level2.tmx
  • level1 文件仅包含文本信息。
  • level2 文件以适当的 TMX 标签封装了 OmegaT 的特殊标签,因此它可以在支持第 2 级 TMX 的翻译工具中使用其中的格式信息,包括 OmegaT 本身。
  • OmegaT 文件包含了 OmegaT 特殊的格式标签,因此该文件可用于其他 OmegaT 项目。
  1. tm 目录可包含任何数量的 TMX 文件。文件可是上面提示的三种形式。tm子目录中翻译记忆内容为待翻译文本提供建议。当它们与正在翻译的文本十分相似时,将出现在模糊匹配窗格中。
    如果某TM中某个源片段与待译文本完全相同,OmegaT会按照选项 → 编辑行为……对话框中的设置进行操作。例如(使用缺省设置),在辅助TM中的译文被接受并加上前缀[模糊],这样随后可以通过这个标记检查译文是否正确翻译。
    如果出现tm子文件夹的翻译记忆中多个片段含有相同的源文本,但目标译文不同,含相同源文本的最后一个片段将获得采用。
  2. 如果提供的 TM 译文完全可靠,把它们放到 tm/auto目录以避免大量的[模糊]进行确认,能更有效地预翻译源文本。也就是说待翻译文本中所有与片段相同的文字都会被自动替换,不再需要确认。
  3. 有时需要从翻译记忆中区分出高质量译文与不可靠译文。名为“penalty-xxx”(其中xxx在0到100之间)文件夹中的翻译记忆产生的匹配其匹配度将减少文件夹名称中的数字:例如Penalty-30文件夹中所有TM中100%匹配的条目将减低至70%的匹配度。

打开项目时会把所有的翻译记忆加载到内存中。添加一个辅助 TM 到当前正在工作的项目时,无需退出项目:只要简单地重新载入项目,所做的更改就会生效。

TMX备份

OmegaT会不断在项目/omegat子文件夹的project_save.tmx文件中保存您的工作。

OmegaT还会在每次项目被打开或重新载入时备份翻译记忆到同一子目录的 project_save.tmx.YEARMMDDHHNN.bak。YEAR 是 4 位数的年份;MM 是月份;DD 是日期;HH 和 NN 是前一份翻译记忆保存时的小时和分钟。

如果您认为丢失了翻译数据,可执行下列步骤:

  • 关闭项目
  • 重命名当前的 project_save.tmx 文件(例如改名为 project_save.tmx.temporary
  • 选择最有可能包含所需数据的翻译记忆备份(例如最近的那个或从某个日子的最后版本)
  • 复制并更名为 project_save.tmx
  • 打开项目

这就说明所有的翻译工作其实都保存在project_save.tmx文件或其备份中。

孤立片段

project_save.tmx文件包含了自项目开始以来已翻译的所有片段。如果您修改了项目的分割规则或从源中删除了文件,那么在匹配查看器中可能出现孤立字符串。这样的匹配指向源文档中不存在的片段。

重用翻译记忆

创建项目后,主TM文件project_save.tmx是空的,翻译时逐步进行填充。重用现有的翻译,可加快这个过程。

OmegaT创建目标文档时,项目的翻译记忆将会在根目录中输出三份文件。可将这三份 TMX 文件(-omegat.tmx-level1.tmx-level2.tmx)视为一份“导出的翻译记忆”,即当前项目的导出双语形式。

如果希望复用之前某项目的翻译记忆,可将该项目的tmx用作“输入翻译记忆”,即将这些翻译记忆文件放置在新项目的/tm/tm/auto目录下。

注意:程序启动时,/tm中所有 TMX 文件将会被解析,因此将过多的 TMX 文件导入将减慢OmegaT的运行。当翻译记忆文件的内容转到project-save.tmx文件后,可考虑移除那些不再需要的文件。

导入和导出翻译记忆

OmegaT 支持导入 tmx1.1-1.4b 版本(包括级别 1 和级别 2),可以在 OmegaT 中使用其他工具创建的翻译记忆。OmegaT在加载翻译记忆文件时遵循非常严格的过程。如果在文件中发现了错误,将提示问题文件中发现错误的位置。

OmegaT导出1.4版本的TMX文件(包括级别 1 和级别 2)。导出的级别2不是标准的级别2,但足以在支持 TMX级别2的翻译工具中产生正确的匹配。如果您只需要文本信息(而不是格式信息),可以使用级别1文件。

创建所选文档的翻译记忆

如果需要和他人分享部分翻译内容时,不能直接讲ProjectName-omegat.tmx分享。可采用下述简单技巧:

  • 使用其它名称创建一个独立项目。
  • 复制希望获取翻译记忆的源文档到项目的源文件夹。
  • 复制包含上述源文档翻译的翻译记忆到新项目的tm/auto子文件夹。
  • 打开项目。使用Ctrl+T检查标签错误,并用Ctrl+U检查未译片段。一切就绪后,按下Ctrl+D创建目标文档并检查其内容。
  • 完成

更新翻译记忆

OmegaT 的早期版本只能将源文本按照段落切割成片段,而且对HTML和开放文档文件的格式标签编号时会出现前后不一致。OmegaT可以实时检测并更新这样的TMX文件,以此提高模糊匹配的质量、提高现有翻译的水平,减少您的手工操作。

项目的 TMX 只会更新一次,且会以更新过的格式写入 project-save.tmx,而每次项目被载入时都会对所继承的TMX文件进行更新

注意:修改OmegaT中的文件过滤器在某些情况下可能会导致完全不同的片段分割结构,结果在少数情况下您必须手动更新译文。

词汇表

简介

词汇表可保存术语,使得前后文术语保持一致,并可与其它文件重用。默认情况下,文件必须在/glossary文件夹,或较深层的文件夹(如glossary/sub/glossary.txt)。如果该文件不存在,添加词条时会自动创建。如果该文件已存在,不会对其格式或字符集进行检查,新条目总是以tab分隔并使用UTF-8编码。

用法

要使用现有词汇表,只需在创建项目后将它放到/glossary目录下。在打开项目时,OmegaT自动检测该目录下的词汇表文件。从词汇表中找到当前片段中的术语后,OmegaT 将会在词汇表窗格将它们显示出来。

文件格式

词汇表文件是简单的纯文本文件,包含了以制表符分隔的三列,第一和第二列分别对应源词汇和目标术语,第三列保存附加信息。

可以添加目标列为空的条目,即只包含源术语和注释。

支持 CSV 格式。该格式和 TAB 分隔的相同:源术语,目标术语。注释字段使用逗号 ',' 分隔开来。字符串需要括在引号 " 里面,这样可以在字符串中使用逗号:

"I'm tina","我是tina"

支持 TBX 格式。TBX(Term Base eXchange)是用于交换结构化术语数据的 XML开放国际标准。微软术语集 可以下载将近 100 种语言的术语,它们可以作为IT词汇表的基础。

创建词汇表

在词汇表窗格点击右键或按下Ctrl+Shift+G来添加新条目,对话框中可以输入源术语、目标术语及注释。

用語集を作成します。

也可以采用其它文本处理软件,直接编辑词汇表文件。保存被编辑文件后,更改会立即作用。

跟我做

\glossary目录下新建一个test.txt,输入以下内容(注意:确保文件为utf-8编码,中间用tab隔开。):

beijing  北京  中国首都

我们创建了一个词汇表,并为beijing术语添加了解释。

然后在\source目录下创建一个cihuibiao.txt文件,输入以下内容:

Beijing is our capital.

重新加载该项目,切换到cihuibiao.txt文件,所得结果如下图所示。

用語集

术语也可以是一个单词组合或句子,比如将上文的test.txt更改为

Beijing is our capital  北京是我们的首都。

结果如下

用語

高亮词汇表中的解释,然后右键即可插入光标位置。
挿入

机器翻译

与翻译记忆相对的是机器翻译工具,它使用基于规则的语言学工具而不是翻译记忆来创建源片段的翻译。

要激活某种机器翻译服务,请前往选项>机器翻译……,然后激活需要的服务。注意:必须在线才能使用。

  • 谷歌翻译 由谷歌提供的付费服务。
  • Belazar 是用于俄罗斯-白俄罗斯语言对的机器语言翻译工具。
  • Apertium 是自由、开源的机器翻译平台
  • yandex 等。

下面简单介绍配置Yandex的过程。

  • 前往https://translate.yandex.com 注册
  • 申请API key,并复制

アプリケーションのAPIキー

  • 将申请到的key复制到OmegaT.l4J.ini文件中

コンフィギュレーション

  • 重新打开项目,即可使用机器翻译

機械翻訳の例

机器翻译的结果并不可靠,只能提供一种参考。

分割规则

翻译记忆软件将待译文件按照一定规则分割成片段,逐片段翻译,既减少了单次工作,又为复用奠定基础。

OmegaT使用两种方式对文本进行片段分割:段落分割或句子分割。

要选择分割类型,请从主菜单选择项目 → 属性,然后选用选中或取消选中相应的复选框。

在某些情况中使用段落分割是有好处的,例如在与创造性和文学性高度相关的翻译中,译员可能需要改变整个段落的顺序;然而,对于大多数项目,应优先选择句子分割,因为这样可以与以前的翻译实现更好的匹配。

许多语言已包含可靠的分割规则,所以很可能您不需要自己编写分割规则。自定义分割规则在特殊情况下可能非常有用,您可以针对需要翻译的文本设置分割规则来提高生产力。

注意:由于在改变过滤器选项后将对文本进行不同的分割,所以您可能需要从原文开始进行翻译。同时,在项目翻译记忆中原来有效的片段将变成孤立片段。如果您在项目打开的时候改变分割规则选项,您必须重新载入项目以使改变生效。

结构层片段分割
OmegaT 首先将文本分割成结构级别的片段。在这个过程中,只有源文本的结构被用于创建片段。例如:文本文件可能会在行终止、空行进行片段分割或根本进行分割。格式化文件(ODF文档、HTML 文档等等)在块级别(段落)标签处进行分割。XHTML 或 HTML 文件的可翻译对象属性可以被提取为独立的片段。

语句级分割
在将源文件分割为结构单元之后, OmegaT 将进一步把这些块分割为语句。

分割规则及优先级

片段分割过程可描绘如下:光标沿着文本移动,每次一个字符。在每个光标位置,由之前之后的模式组成的规则以指定的顺序应用,即对左边的文本使用之前模式同时对光标右边的文本使用 之后 模式。如果规则匹配,光标继续移动而不进行分割(对于例外规则)或者创建一个新片段(为中断规则)。

中断规则
将源文本分割为片段。例如,"Did it make sense?I was not sure." 应该分割成两个句子。要实现这样的目的,应该在 "?" 后跟着空格和大写字符时进行中断的规则。要定义一个中断规则,请选中中断/例外复选框。

例外规则
指定哪部分文本不应该被分开。不考虑句点的话, "Mrs. Dalloway " 不应被分割成两个片段,因此应该为后面跟着句点的 Mrs (以及 Mr 和 Dr 、prof 等等) 创建例外规则。要定义例外规则,请取消选中中断/例外复选框。

规则的优先级
为匹配的语言模式定义的所有片段分割规则会按照规定的优先级别得到应用,因此为特定语言定义的规则优先级会比缺省规则要高。

自定义规则

一般应避免对分割规则进行大幅调整,尤其在开始翻译后,但进行细微修正,例如加上识别的缩略语,可能会有好处。

如果需要自定义分割规则,可以单击选项->分割规则打开如下对话框。

分節規則

点击新增,即可添加新规则,然后添加之前和之后模式。

目的 前模式 后模式 说明
(「」)期間を提供するような新しいフラグメントタブの開始位置の後にスペースが続きます。 \。 \ sの 「\。」ピリオド文字を表します。「\ S」は、任意の空白文字(スペース、タブ、改行など)を表します。
氏は後に分割しないでください。 氏。 \ sの これはルールの例外である、チェックボックスのルールをキャンセルする必要があります。
スプリットで。「」(日本時間)の後に ルール後のパターンが空であることに注意してください
ないM.氏、夫人、氏と分割後のコンテンツ 夫人??。 \ sの 例外 - 正規表現での使用を参照してください?

ショートカット

使用のショートカットは、ソフトウェアの効率を向上させることができます。設定ファイルを変更することで、OmegaTは、ほとんどのメニューのショートカットを設定することができます。

以下に示す一般的に使用されるデフォルトのショートカットです

  1. プロジェクト関連
    • オープン Ctrl+O
    • リロード F5
    • 近いです Ctrl+Shift+W
    • 保存 Ctrl+S
    • 翻訳の作成文書をCtrl+D
    • プロパティ Ctrl+E
    • プロジェクトファイル Ctrl+L
    • やめます Ctrl+Q
  2. [編集]メニュー
    • 直前の操作を取り消します Ctrl+Z
    • 前の操作をやり直し Ctrl+Y
    • 試合と交換 Ctrl+R
    • 挿入試合 Ctrl+I
    • 機械で翻訳を交換してください Ctrl+M
    • ソーステキストに置き換え Shift+Ctrl+R
    • ソーステキストを挿入 Shift+Ctrl+I
    • ソースタグを挿入します Shift+Ctrl+T
    • エクスポート選択された部分 Shift+Ctrl+C
    • 用語集のエントリを作成します。 Shift+Ctrl+G
    • プロジェクトの検索で...... Ctrl+F
    • 最初のマッチを選択 Ctrl+1
    • 第二試合を選択 Ctrl+2
    • 第三試合を選択 Ctrl+3
    • 第四試合を選択 Ctrl+4
    • 第五試合を選択 Ctrl+5
    • 周期変更ケース Shift+F3
  3. メニューに移動します
    • 後者の断片デコードされていません Ctrl+U
    • セグメントの後 Ctrl+N或Enter或Tab
    • フロントセグメント Ctrl+P或Ctrl+Enter或Ctrl+Tab
    • 特許断片 Ctrl+J
    • 歴史の中でフォワード Ctrl+Shift+N
    • 歴史の中でフォールバック Ctrl+Shift+P
  4. 他の
    • 検査ラベル Ctrl +T
    • 取扱説明書 F1

おすすめ

転載: www.cnblogs.com/fuyude/p/OmegaT_intro.html