1 コア機能の進捗
過去 1 か月足らずで、FaceChain オープン ソース プロジェクトはゼロから成長し、関連テクノロジーのボトルネックを突破することに成功しました。GitHub ( GitHub - modelscope/facechain: FaceChain は、デジタル ツインを生成するための深層学習ツールチェーンです。 ) 4.6 K スター以上を達成し、将来のアプリケーション開発のための強固な基盤を築きました。私たちが実装した主な機能の一部を次に示します。
-
少なくとも 1 枚の写真をトレーニングして特定のキャラクター LoRA を生成することができ、生成されたキャラクターのポートレート写真は鮮やかで美しいものになります。関連する原則については、論文で詳しく説明されています: https://arxiv.org/abs/2308.14256
-
キャラクターの動きや姿勢を正確に指定する
-
妖精スタイル、ポラロイド香港スタイル、ガーデンウェディングドレス、冬の漢服、キャンパススタイルなど、LoRAスタイルの無限の拡張が開かれています。
その他のスタイルの DIY チュートリアル:
【実践チュートリアル】無限シーン風LoRAと固定キャラLoRAの融合 - Cool Frog FaceChain0826 Weekly (GitHubには4Kスターが!)
2 アプリケーションシナリオの前提条件
FaceChainアプリケーションエコシステムの爆発的な成長からはどのくらい離れているのでしょうか? 私たちは、次のような考えられるアプリケーション シナリオのいくつかを想定しています。
-
さまざまなシーンでLoRA風のキャラクターポートレートを生成(実現済みですが、無限に拡張可能です)
-
キャラクターコミックストーリーを作成します。
-
キャラクターの絵文字を作る
-
サッドトーカーを組み合わせてキャラクタービデオを生成する
-
映画とテレビ、アニメーションのキャラクターデザインと生成
-
無限の可能性……
3 やることリスト
これらのアプリケーションを実現するには、FaceChain は依然としていくつかの技術的問題を克服する必要があります。
-
背景が固定された人物のポートレートを指定します (修復技術を習得する必要があります)。
-
HD解像度の画像生成。
-
ピクチャ スタイルの拡張 (3D、漫画、ジブリなどの特定のアニメーション スタイルを含む)。
-
LLM+SD を組み合わせて連続した一連の画像を生成し、完全なストーリーを形成します。
-
連続ビデオ生成
-
……
4 開発者への招待
オープンソース プロジェクトとして、私たちは革新的な思考と熱意を持ったより多くの開発者の参加を心から歓迎します。
また、以下に貢献した開発者を表彰します。
-
プロジェクトに関連するチュートリアル記事に貢献してください。
-
Github 上でプロジェクトの PR と発行に貢献します。
-
プロジェクト関連のモデル (スタイル LoRA など)、トレーニング データ セット、派生クリエイティブ スペース アプリケーションを Mota プラットフォームに同時に提供します。
貢献者は、modelscope プラットフォーム上でプロジェクト貢献証明書と無料コンピューティング時間報酬を受け取る機会があり、さらに重要なことに、興味深い開発者のグループに会い、興味深いプロジェクトを一緒に構築できることです。
私たちのプロジェクトの規約 (興味深い、役に立つ、良い、美しい) にも同意する場合は、原文にジャンプしてサインアップしてください。
私たちは、FaceChain オープンソース プロジェクトの持続可能な発展を期待し、人工知能技術の新しいトレンドをリードします。
さらに技術的な詳細をお知りになりたい場合は、今週金曜日の「AI モデル クラブ」のライブ ブロードキャストにも注目してください。原理の説明と実践的なデモンストレーションがあります。コードをスキャンしてライブ ブロードキャストの予約をすることができます。