Jinglianwen Technology は、マルチモーダル音声翻訳モデルのデータ収集サポートを提供できます

Facebook の親会社である Meta Platforms は 8 月 22 日、数十の言語を翻訳および転写できる人工知能モデル SeamlessM4T をリリースしました。これにより、日常生活やビジネス コミュニケーションにおいて、より便利な翻訳および転写サービスをユーザーに提供できます。

従来のテキスト翻訳と比較したこの技術の最大の違いは、エンドツーエンドの音声翻訳、つまり、ある言語の音声を別の言語に直接翻訳できるため、人々は複雑な中間手段を介さずに直接コミュニケーションできることです。変換プロセス。

SeamlessM4T は以下をサポートします。

1. 100 近くの言語での音声認識。

2. 100 近くの入出力言語の音声からテキストへの翻訳。

3. 約 100 の入力言語と 36 の出力言語の音声翻訳をサポートします。

4. 100 近くの言語でのテキストからテキストへの翻訳をサポートします。

5. 約 100 の入力言語と 35 の出力言語でのテキスト音声翻訳をサポートします。

SeamlessM4T でサポートされる音声対音声変換モデルには、大量の高品質のエンドツーエンド データが必要です。音声翻訳データセットを構築するプロセスは複雑でコストがかかるため、手作業による音声の書き起こしと翻訳だけに頼って、約 100 言語の音声翻訳の需要を満たすことは困難です。許可された音声を取得することを前提として、対応する書き起こしと翻訳を実行する必要があります。次に、音声、書き起こし、翻訳をセグメント化し、最後に整列してフィルタリングして有効なデータを取得する必要があります。

Jinglianwen Technology は、音声データの収集と注釈プロジェクトで豊富な経験を持ち、実際のシーンを復元する高度な能力を備えた独自のプロ仕様の音声収集および録音スタジオを構築しており、全国 30 以上の省と都市に 10,000 人近くの人員を集めています複数の言語や方言での音声収集をサポートする収集チャンネルもあります。自己所有のデータ管理プラットフォームはデータの閉ループを開き、データの配布、クリーニング、注釈、品質検査などを秩序ある方法で実行でき、高品質のトレーニング データを提供し、エンタープライズ AI データ トレーニングの効率を向上させます。人工知能関連アプリケーションの実装と反復を加速します。

Jinglianwen Technology|データ収集|データアノテーション

人工知能テクノロジーを促進し、伝統的な産業のインテリジェントな変革とアップグレードを強化します。

記事のグラフィックとテキストの著作権は Jinglianwen Technology に属します。商業的転載の場合は、許可について Jinglianwen Technology にお問い合わせください。非商業的な転載の場合は、出典を示してください。

おすすめ

転載: blog.csdn.net/weixin_55551028/article/details/132759907