デジタルヒューマン製品評価:D-ID/HeyGen

最近、デジタル ヒューマン生成ツールである D-ID、HeyGen、SadTalker を試してみました (このうち、SadTalker は SD オープンソースなので、特別な紹介はしません)。

これらのデジタル ヒューマン ツールに関するチュートリアルはインターネット上にたくさんありますので、自分で検索して学ぶことができます~ この記事は主にユーザーのプロダクト エクスペリエンス デザインについての雑談であり、AGI プロダクト エクスペリエンス デザインの雑談 001 - デジタル ヒューマンの世代でもあります。


した

アクセスリンク:https://www.d-id.com/

2d40cfe411079549730a4445eeeeb998.png

(写真素材はD-ID公式サイトより)

D-IDの製品機能の一つ、チャット。D-ID、対面チャットダイアログ。たとえば、販売、顧客サービス、トレーニング、その他のシナリオでは、デジタル ヒューマン モデルを使用してコミュニケーションを行います。API インターフェイスとモデルの統合もサポートしています。

47ac05dc72a033c1522624ca1929d00f.gif

D-IDの2つ目の製品機能はデジタルヒューマンの作成です。現在、作成方法は 2 つあり、1 つはプロンプト生成、もう 1 つはイメージ生成です。音声は GPT3 入力、テキスト入力、オーディオ入力をサポートします。

59470459ca327b880937529ae96cb205.gif

両方の方法を試しました。キーワードも何度も調整されており、プロンプトによって生成される数字は少し目を引くものです。付属のものを使用したくない場合は、独自の写真をアップロードすることをお勧めします。

アップロード画像生成e74df7376076a9d8667243fe9355dd29.png

即時生成

2a99f99f38483114c161b25577ba60fa.png

インタラクションプロセスは比較的単純です。登録後、直接メインインターフェイスに入り、デジタルヒューマンを生成します。マウスクリックと入力がメインで音声入力はありません。

インターフェースのレイアウト構造設計、よりエンジニアリング指向。情報のモジュール化は比較的明確ですが、人間とコンピュータの対話フレームワークは比較的厳格です。ユーザーの主な操作がデジタルポートレートの作成である場合、インターフェース情報が冗長になり、操作する必要のない機能がインターフェース枠全体に固定され、スペースの有効活用が制限されてしまいます。

303d4cb99385dcb76bd82e4a9d13f79b.png

音声、国と地域の言語(呉農ソフト言語方言も含む)、性別(さまざまな年齢層の音質を含む)、トーン(ネガティブな感情とポジティブな感情)を選択できます。デジタル ヒューマン生成後のエフェクトは、基本的に単純なデジタル ヒューマンのニーズを満たしていますが、無料版のせいか、口の形状の一致と画質があまり良くありません (この記事の冒頭のビデオを参照)詳細については)。

8be783fd9c06fcd5d72b5494abcf6350.png

71b89cdb804c7d4a94551da63ab54e80.png

c04084320b5bcc202eaec06d524648b3.png

製品価格の位置付けは以下の通りです。D-ID デジタル パーソンの無料体験は 20 分に制限されています。

8c0cb3318d750f12ef180e4c93cdce87.png

ヘイ、ゲン

招待リンクをクリックします: https://app.heygen.com/guest/templates?cid=a01967c5

8ca407ef99917046c14c31694ade9574.png

(写真素材はHeyGen公式サイトより)

c27891e4f6b87bad2201e659dcc5b16e.png

製品の主な機能を紹介するD-IDに比べ、HeyGenの公式Webサイトはマーケティングコンテンツが多い。たとえば、HeyGen を選択した 4 つの理由と、5 つのターゲット シナリオでの適用事例により、人々は製品の使用方法を十分に理解できます。

b4ecd13c2dabbc5bbdff28dbf64adba2.png

アップロード画像生成

a8605d3b43c576af4b33f66e37fd60cf.png

プロンプト生成機能を搭載

9f54e489bc06ae2c99deec7cb73270d2.png

適切なデジタル ヒューマン写真をアップロードし、独自のデジタル ヒューマン モデルを構築することをお勧めします。

使用プロセスにおいて、HeyGen はユーザーのステップを分解しました。ユーザーが水平または垂直インターフェイスを選択し、生成されたコンテンツを編集する場合、インターフェイスは次のようになります。HeyGen には豊富なビデオ テンプレートが用意されており、自分で編集して PPT を生成することもできます。

4ec4094d9486b074d4368d8946d8d6c9.png

音声入力、通常のテキストとアップロード音声に加えて、HeyGen は 5 分間の音声入力を提供します。

f84fd083e12ad376c490a89699a972f3.png

サウンド オプションには多くのコンテンツが含まれており、HeyGen は選択できる別のレイヤーであり、フィルター項目が設定されているため、比較的明確です。

c72624f8c678c930593c37de7f65bba8.png

製品価格の位置付けは以下の通りです。HeyGenデジタルヒューマン毎日1分間の無料体験。

df035a6815b922967ba3b1459dbe7e0a.png

デジタルヒューマン生成ツール

D-ID、HeyGen...の他にも、シンセシア、ピクトリー...などのデジタルヒューマン向けのAGIツールが多数あります。また、fakefaceなどのビデオ顔を変える技術や、kupidなどのオンラインチャット版Her、 Chriper のようなクリエイティブなデジタル ヒューマン... デジタル ヒューマン生成ツールのユーザー エクスペリエンスと、実際のアプリケーション シナリオにおけるデジタル ヒューマンのエクスペリエンスは、2 つの別個のトピックですが、関連しています。今回はデジタルヒューマン生成ツールの体験についてのみ話しましたが、メッセージを残してもっとコミュニケーションすることを歓迎します〜

8d64ca60a284ff506b1015d58c4f6bb8.jpeg

コミュニティの入り口

cd6e0e5b5e69d427bb09d450f5b28df6.jpeg

おすすめ

転載: blog.csdn.net/shadowcz007/article/details/131618243