免責事項:
この場合に使用されるインストール パッケージは、営利目的ではなく無料で提供されます。
皆さんこんにちは、雨でも晴れでも私は元気です。
おそらく、製品マーケティングであろうとブランドプロモーションであろうと、多くの人がデジタル人材の形で自分自身の富を築いていることをよく目にするでしょう。ただし、市場のデジタル担当者の手数料は数千から数万と比較的高価です。
では、独自のデジタル ヒューマン ビデオを無料で作成するにはどうすればよいでしょうか?
実は非常に簡単で、安定版にsadtalkerプラグインをインストールするだけで簡単にデジタルヒューマンを生成することができます。
まだsadtalkerプラグインをインストールしていない方は、前回の記事AI絵画安定拡散研究(12) SDデジタルヒューマン作成ツール SadTlakerプラグインインストールチュートリアル をご確認ください。
今日は、SadTlaker プラグインを使用して、話すデジタル ヒューマン ビデオを作成する方法を説明します。
皆さんも私の手順に従い、すぐに実践して効果を実感してください。
1. 写真を準備する
写真: 人物の正面写真を準備します。SD 文勝マップまたは土生マップ機能を使用して生成することも、その他の写真を作成することもできます。
ここでは、SD マップを使用して画像を生成する別のデモンストレーション、正面画像を生成する手順を示します。
(1) C駅に行き、参考となる正面図を探します。
(2) 大きなモデル: majicMIX real をダウンロードし、models\Stable-diffusion ディレクトリに置きます。
次に、安定拡散を再起動してモデルを有効にします。
\sd-webui-aki-v4.2\models\Stable-diffusion
(3)、写真をダウンロードしてTushengtuにアップロードし、関連パラメータを設定します
- 画像をアップロードする
- 順方向プロンプトと逆方向プロンプトを設定する
- CLP 終端層の数は 2 に設定されます。
- ランダムシードを設定する
- サンプリング方法を設定する
- 再描画サイズを設定する
- 顔の修復をオンにします (重要: オンにしないと、キャラクターの顔にシミやほくろが表示されます)
(4) [生成] をクリックしてキャラクターの正面写真を取得します。
2. 音声ファイルを準備する
音声ファイル形式:MP3またはwavファイル。
オーディオ ファイルの許容される長さ: ビデオ メモリのサイズによって決まります。
オーディオ ファイルの生成: chatgpt を使用してコピーライティングを生成し、ダビング ツールを使用してオーディオを生成して保存できます。もちろん、自分で音声を録音することもできるので、ここでは詳しく説明しません。
ここではデモンストレーションのために、14 秒程度の音声セクションがあらかじめ用意されています。
3. SadTlaker を使用してデジタル ヒューマン ビデオを合成する
(1) ファンクションバーエリアで、SadTlakerタブページに切り替えます。
(2) SDで生成したばかりのキャラクターの正面写真をアップロードします
(3) 用意した音声ファイルをアップロードする
(4)、パラメータ設定と詳細説明
-
姿勢スタイル: 顔の姿勢、合計 47 の数字、それぞれの姿勢が異なり、テストして好きな姿勢を選択できます。
-
顔モデルの解像度: 解像度に応じて独自のリップシンク モデルを選択します。画像が大きい場合は、512 を選択します。
-
前処理: この設定はグラフ内の設定と同じです。
-
静止画モード: 必要なジェスチャーが少なく、処理が充実しています。
-
GFPGANを使って顔を強調する:高精細化処理するかどうか
これは私の設定です、次のようになります。
(5) 「生成」ボタンをクリックしてビデオを合成します
ビデオのプレビュー ウィンドウにビデオ処理ステータスが表示され、コンソールでも処理の進行状況を確認できます。
処理が完了するまで待ちます。
A. 前処理完了 + 静止モードによって生成されたビデオ:
SDプラグインSadTlakerで作ったトーキングナンバー
B. 前処理とトリミングによって生成されたビデオ:
SDプラグインSadTlaker製Talking Number 2
コントラスト効果:
方法 A で生成されたビデオの動きの範囲は小さくなりますが、画像は元のサイズを使用します。
方法 B で生成されたビデオは、動きの範囲が大きく、画像が切り取られますが、効果はより現実的で自然です。
さて、これでSDデジタルヒューマン作成チュートリアルは終了です。