ダルマ最新のAI技術のヘルプ病院Lynxのダブル11は、ほぼリアルタイムの音声インタラクティブな体験を提供します

11月8日、記者は新人ホットラインのロボット、ロボット音声小米科技、機械知能研究所のアリババダルマスクール最新の研究--KAN-TTSは、最初の大規模は、この技術をもとに、ダブル11今年のLynxを適用されることを学びましたそして、Lynxは近いウィザードは、世界中のライブ音声インタラクティブな体験を消費者に提供します。

1960年にTTS(テキストにスピーチ)技術の誕生にバックデート、人工知能の基本的な技術の一つであるマシンが話してみようが、マシンは鮮やかな音を出してみましょう、常に問題となっている、それは伝統的な声と理解されます合成は、大量のテキストおよび音声情報、合成音声のみ85%〜90%の間の元のオーディオ近さを必要とします。

画像

7月には、ダルマの病院は、音声合成技術KAN-TTS、97%以上への最初の増加、この数の新世代をリリースしました。これは、再び飛躍の強度を高めるために、2019年「グローバルトップテンの画期的な技術、」アリババ音声技術の後にテクノロジー・レビュー命名されると考えられています。

転送アルゴリズムや新モデルの様々な学習、KAN-TTSはすぐに非常に類似した音声のスタイルに応じて、特定のスピーカーを生成することができ、音声合成と大幅に携帯電話の10分を記録し、しきい値を低減し、マシンは模倣音にアルゴリズムによって完成することができます。

過去数ヶ月の間、KAN-TTS技術は、このような優しい、甘い、厳しいなど41高音質で利用可能な一般的なシナリオ、顧客サービスのシナリオ、幼稚なシーン、英語のシーンや方言シーン、ためにすることができ主流のシーンスタイルの音の完全なカバレッジを達成していますその他のスタイル。達磨の病院の専門家によると、チームはまた、視覚障害やスピーチが損なわバリアフリーコミュニケーションを支援するための技術を使用することを計画していました。

2年間のダルマ病院の設立以来、アリババはビジョン、音声と自然言語処理などの分野で世界記録の数を設定している、と中国最大の人工知能会社として浮上しました。今年のカンファレンスYunqi杭州は、アリババはアリAIは、世界中、毎日処理画像10億、映像、音声の120万時間、自然言語55万時間、500億ドルに10億人にサービスを提供する、1000000000000日かけて呼び出すと文。

おすすめ

転載: yq.aliyun.com/articles/726312