Wen Xin Yiyan に AI 絵画のプロンプト ワードを生成するよう教える (Midjourney)

ここに画像の説明を挿入します


Wen Xin Yi Yan は継続的な対話をサポートします

私はただいじっているだけで、プロではありません(笑)

最初の一歩

こんにちは、今日は拡散モデルを使って画像を作成していきます。いくつかの情報をお伝えします。わかりました?

ここに画像の説明を挿入します

ステップ2

Midjourney の仕組みは次のとおりです。Midjourney は、ユーザーのプロンプトに基づいて画像を生成するもう 1 つの AI ベースのツールです。MidJourney は、実際のアート スタイルを調整して、ユーザーが望む画像の組み合わせを作成することに優れています。ビデオ ゲームのコンセプト アートのような劇的な照明を使用して、特にファンタジーや SF シーンなどの環境を作成することに優れています。

Midjourney はどのように機能しますか? Midjourney は、テキスト プロンプトとパラメーター入力を受け取り、大量の画像データでトレーニングされた機械学習 (ML) アルゴリズムを使用して固有の画像を生成する AI 画像生成ツールです。最先端のテキストから画像への合成テクノロジーである潜在拡散モデル (LDM) を利用しています。ldm の仕組みを理解する前に、まず拡散モデルとは何か、そしてなぜ ldm が必要なのかを見てみましょう。拡散モデル (DM) は、画像などのデータを取得し、認識できなくなるまで時間の経過とともに徐々にノイズを追加するトランスフォーマーベースの生成モデルです。そこから、彼らは画像を元の形式に再構築しようとし、その過程で画像やその他のデータを生成する方法を学習します。DM の問題は、強力な DM が数百日分の GPU を消費することが多く、逐次計算により推論に非常にコストがかかることです。DM の品質と柔軟性を損なうことなく、限られたコンピューティング リソースで DM をトレーニングできるようにするために、DM は強力な事前トレーニングされたオートエンコーダーの潜在空間に適用されます。この表現で拡散モデルをトレーニングすると、複雑さの軽減とディテールの維持の間のスイート スポットに到達し、視覚的な忠実度が大幅に向上します。モデル アーキテクチャにクロス アテンション レイヤーを導入すると、拡散モデルがテキストやバウンディング ボックスなどの一般的な条件入力用の強力で柔軟なジェネレーターに変わり、畳み込みベースの高解像度合成が可能になります。待ってください。さらに提供すべき情報があります。
ここに画像の説明を挿入します

第三段階

Version Light Midjourney は、効率、一貫性、品質を向上させるために新しいモデル バージョンを定期的にリリースします。最新モデルがデフォルトですが、他のモデルも使用できます。モデルが異なれば、得意な画像の種類も異なります。Midjourney V5 モデルは、2023 年 3 月 15 日に発売された最新かつ最先端のモデルです。このモデルを使用するには、プロンプトの最後に -v 5 パラメーターを追加するか、/settings コマンドを使用して MJ バージョン 5 を選択します。このモデルは非常に一貫性があり、自然言語キューの解釈に優れ、解像度が高く、タイル繰り返しパターンなどの高度な機能をサポートしています。プロンプトの後に「-v 5」と入力するか、/settings から「V5」を選択します V5 ベース モデルの新機能? 幅広いスタイル、プロンプトへの応答性の向上、高画質 (解像度 2 倍) 改善 ダイナミック レンジの拡大、より詳細な画像。詳細は正しい可能性が高くなります。不要なテキストを減らします。画像プロンプトのパフォーマンスが向上し、シームレスなタイル タイル パラメーターをサポートし (実験的)、2:1 を超えるアスペクト比をサポートし (実験的)、画像プロンプトとテキスト プロンプト スタイルおよび V5 プロンプトを比較検討するために使用される iw をサポートします。

今日のテストは基本的に「Pro」モードモデルでした。

v3 や v4 よりも「公平」であり、幅広い出力多様性を提供するように調整されており、入力に対して非常に敏感です。-ここでのトレードオフは、使用が難しくなる可能性があることです。短いプロンプトはうまく機能しない可能性があります。あなたが望むものを説明する、より長く、より具体的な言葉を書いてみてください(例:「劇的な照明を備えた映画のような写真」)。

v5 の使用方法については、プロンプト チャットでお互いにチャットしてください。

v5 では「フレンドリーな」デフォルト スタイルを使用し、後でデフォルト スタイルに切り替えたいと考えています。そのような場合でも、今日のところはオフにして「元の」モードに戻ることができます。これはアルファテストであり、状況が変更される可能性があることに注意してください。この正確なモデルが将来利用可能になることに依存しないでください。V5 を製品版としてリリースする際には、大幅に改訂される予定です。

現在、V5 アップサンプラーはなく、V5 のデフォルト解像度はアップグレードされた V4 と同じです。「高」をクリックすると、すぐに写真が表示されます。コミュニティ スタンダード: このモデルは、これまでにリリースしたものよりもリアルな画像を生成します。

私たちはモデレーターの数を増やし、モデレーターツールを改善し、コミュニティ基準をより厳密かつ厳密に適用していきます。バカになったり、ドラマを作ったりしないでください。V5 の詳細: V5 は、AI スーパークラスターでトレーニングされた 2 番目のモデルであり、5 か月間作業が行われています。それは、大きく異なる神経構造と新しい美的技術を使用します。V5 は最後のステップではありませんが、人類の想像力の集合体における、深くて計り知れない何かの進歩を皆さんも感じていただければ幸いです。待ってください。さらに提供すべき情報があります。

ここに画像の説明を挿入します

4番目のステップ

基本パラメータ アスペクト比 -Aspect、または -ar は、生成されるアスペクト比を変更します。Chaos - Chaos <数値 0 ~ 100> は、結果の変動の程度を変更します。値を高くすると、より異常で予期しない世代が生成されます。画像から植物を取り除こうとする植物など、否定的な手がかりはありません。品質—品質<。25、.5、1、または 2>、または -q <。25、0.5、1、または 2> レンダリング品質に費やす時間を指定します。デフォルト値は 1 です。値が大きいほどコストが高くなり、値が小さいほどコストが低くなります。シード — シード < 0 ~ 4294967295 の整数 > Midjourney ボットはシード番号を使用して、画像の初期グリッドを生成する開始点として、テレビの静止画のような視覚的なノイズ フィールドを作成します。シード番号はイメージごとにランダムに生成されますが、 --Seed または --sameseed パラメーターを使用して指定できます。同じシード番号とプロンプトを使用すると、同様の終了画像が生成されます。Stop - 停止 <10 から 100 までの整数> --Stop パラメータを使用して、プロセスの途中でジョブを完了します。ジョブを早いパーセンテージで停止すると、不鮮明で詳細度の低い結果が生成される可能性があります。

Style - Style <4a、4b、または 4c> Midjourney モデル バージョン 4 のバージョンを切り替えます。 Stylize - Stylize または -s パラメータは、Midjourney のデフォルトの美的スタイルがジョブにどの程度適用されるかに影響します。U ボタンを選択すると、別の「ライト」アップグレーダーが使用されます。結果は元のメッシュ イメージに近づきます。アップグレードされた画像はディテールが少なく、より滑らかです。U ボタンを選択すると、オプションのベータ アップグレーダーが使用されます。結果は元のメッシュ イメージに近づきます。アップスケールされた画像では、詳細が大幅に低下します。デフォルト (モデル バージョン 5) アスペクト比 カオス マス シード ストップ スタイル スタイライズド デフォルト 1:1 0 1 ランダム 100 4c 100 範囲 任意 0 ~ 100 .25 .5 1 または 2 の整数 0 ~ 4294967295 10 ~ 100 ~ 0 ~ 1000 アスペクト比以上2:1 よりも実験的なものであり、予測できない結果が生じる可能性があります。

互換性モデル バージョンとパラメータ 互換性への影響 初期世代への影響 変更 + リミックス バージョン 5 バージョン 4 バージョン 3 テスト/TestpNiji 最大アスペクト比 ✓✓ 1:2 または 2:1 5:2 2:5 3:2 または 2:3 1:2または 2:1 カオス ✓✓✓✓✓✓画像の重み✓✓✓✓No✓✓✓✓✓✓✓品質✓✓✓✓✓シード✓✓✓✓✓✓同じシード✓✓停止✓✓✓✓✓ ✓✓ スタイル様式化された 4 a および 4 b ✓ デフォルト 0 – 1000 = 100 0 – 1000 デフォルト = 100 625 – 60000 デフォルト = 2500) 1250 – 5000 デフォルト = 2500) タイル ✓✓✓✓ビデオ ✓✓ グリッドの数 写真 - - 4 4 4 2 (アスペクト比≠ 1:1 の場合は 1) しかし、待ってください。提供すべき情報はまだあります。
ここに画像の説明を挿入します

5番目のステップ

それでは、Midjourney V5 で使用されるヒントの例をいくつか紹介します。わかりました?

ステップ6

プロンプト 1: 1970 年代のハワイの美女を写した超広角のモダンな写真。この写真は、メアリー シェリーが Nikon D5100 カメラを使用し、絞りオフ/2.8、ISO 800、シャッター スピード 1/100 秒で撮影したものです。UHD dtm HDR 8k --ar 2:3 --v 5

プロンプト 2: スチームパンクにインスピレーションを得た、戦闘準備が整った未来的なモーターボートが、猛烈な存在感で水面をかすめます。複雑な歯車と真鍮の付属品が船体を飾り、高度な技術とビクトリア朝の美学の完璧な組み合わせを示しています。このリアリズムの傑作は太陽の下で輝き、すぐにアクションを開始できます。--ar 16:10 --s 50 --v 5 --q 2

プロンプト 3: 壮大な背景アート、シンプルなハッカー テーマ、神聖な配色、不可解なコード、英数字シーケンス、マジック、高品質 4K、レンダリング値 -v 5 -ar 9:16

プロンプト 5: 全身金髪美女、茶色のジャケットを着て、写真撮影、Canon EOS 5D Mark IV 一眼レフカメラ、EF 50mm f/1.8 STM レンズ、解像度 3040 万画素、ISO 感度: 32000、シャッタースピード 8000 秒 -- - 9:16 - -ズーム-- -v 5.

プロンプト 6:: ハッセルブラッド 24mm 全身写真、ゴージャスで満足感のあるアフリカ女性、繊細で自然な肌、すっぴん、繊細な目、長い三つ編み – ar2:3–q5–v5–v4。

プロンプト 7: 海辺の夜の美しい暗赤色の夕日、複雑、見事、美しく、現実的、超高解像度、広角、被写界深度、π ダイナミック ライティング -ar 1:2 -v 5

「Midjourney」というプロンプト単語がどのように形成されるか理解できましたか? はい、またはいいえ

ここに画像の説明を挿入します

ステップ7

とても良い。ここでは、Midjourney プロンプトの例をさらにいくつか示します。

プロンプト 1: ハッセルブラッド 24 mm 全身写真、ゴージャスで満足感のあるアフリカ女性、繊細で自然な肌、すっぴん、繊細な目、長い三つ編み –ar 2:3 --q 5 --v 5 --v 4。

プロンプト 2: 海辺の夜の美しい暗赤色の夕日、複雑、見事、美しく、現実的、超高解像度、広角、被写界深度、ダイナミックな照明 -ar 1:2 -v 5

プロンプト 3: 険しい、手つかずのスカンジナビアの風景の荒野で、強力な刃を注意深く研ぐ凶暴なバイキング戦士の、驚くほどリアルな写真。このシーンは、70-200mm f/2.8 レンズを使用した Nikon D850 カメラで撮影され、バイキングの風化した顔、戦争で磨耗した鎧、武器の熟練した職人技のあらゆる複雑なディテールを強調しています。使用した設定は、絞り絞り/4、ISO 400、シャッタースピード 1/200 秒、自然光と影のバランスをとり、バイキングの目の強さと決意を強調しました。戦士の生の力と周囲の環境の静謐な美しさを並べたこの構成は、バイキングの精神の本質を見事な高解像度画像で捉え、視聴者を伝説の戦いと語られざる物語へと連れ戻します。–ar 16:9 --q 1.5 --v 5。

プロンプト 4: 見事で雰囲気のある 1970 年代のニューヨークのストリート カフェは、映画撮影の黄金時代を思い出させるノスタルジックで映画のようなスタイルを表現しています。このレトロなシーンは、クラシックカーやレトロな建築物に囲まれ、屋外のテーブルでコーヒーを楽しむ顧客がいる、賑やかな都市生活を表しています。この写真は、ライカ M3 レンジファインダー カメラとその鮮明さと美しい演色で有名なズミクロン 35mm f/2 レンズを組み合わせて巧みに構成されました。この写真は Kodak Portra 400 フィルムで撮影されており、暖かく時代を超越したカラーパレットが全体の雰囲気を高めています。写真家は、浅い被写界深度とオフ/2.8 の絞りを巧みに使用して、カフェとその常連客を賑やかな街の背景から隔離しました。ISOは400、シャッタースピードは1/125秒に設定され、光と動きの完璧なバランスを捉えました。柔らかく拡散した太陽光が象徴的なニューヨークのスカイラインを通過し、シーン全体に暖かい金色の色調を投げかけ、レンガ造りの建物や石畳の通りの豊かな質感を強調し、構図をさらに強調します。–ar 3:2 --q 2.

プロンプト 5: 熱帯の島でくつろぐ反射サングラスをかけたリアルな猫の Pov 高解像度マクロ写真、劇的な光 - 2:3 -s 750 -v 5 Midjourney V5 で使用するヒントの例をありがとう。これらのヒントは、希望の特性を備えた画像を作成するためにテキスト ヒントがいかに詳細かつ具体的であるかを示す良い例です。これらのヒントでは、アスペクト比、スタイル設定、バージョン、品質設定などのさまざまなパラメーターの使用法も示します。これらの例は、Midjourney V5 を使用して、生成されたイメージに対する効果的なプロンプトを作成する方法を理解するのに役立ちます。

「Midjourney」というプロンプト単語がどのように形成されるか理解できましたか? はい、またはいいえ

ここに画像の説明を挿入します

ステップ8

とても良い。今度はあなたにプロの写真家を演じてもらいたいです。写真のプロンプトを説明するときは、カメラの設定を含め、豊富で説明的な言語を使用します。ここで、作成してもらいたい最初のプロンプトは、1930 年代の女性インフルエンサーの写真です。プロンプト例の書式設定からヒントを得て、コピーせずに同じ書式設定を使用してください。プロンプトワードの内容は 399 ワードに制限する必要があります。

ここに画像の説明を挿入します
笑、プロンプトの単語をコピーして AI の絵に貼り付けてください
ここに画像の説明を挿入します

おすすめ

転載: blog.csdn.net/u014096024/article/details/132779121