独占 | 旅の途中のヒントを書くための上級ガイド (テキストから画像まで) (リンク付き)

0323b8beb6396c7c38e3a0be3c86aaac.png

作者:Lars Nielsen
翻译:陈超
校对:赵茹萱


本文约1500字,建议阅读5分钟
本文共列举了10条如何为Midjourney编写图像生成提示的建议。

ヒント画像の出力を改善するために使用するいくつかのキーワードを含む詳細な「チートシート」。

e14cd9d2454930e53f6e7b9bb7f40dba.png

画像は Midjourney によって生成され、テキスト プロンプト: 美しく夢のような都市 Unreal Engine

Midjourney について聞いたことがない人のために、一文紹介します。 Midjourney は、OpenAI の DALLE-2 や Stable Diffusion の DreamStudio に似たテキスト画像生成アプリで、大量のネットワーク画像 (約 6 億 5,000 万枚) を使用して、見事な画像を生成します。提供されたテキストのヒントに基づいた画像。現在はベータ版ですが、毎週より多くの機能が追加されています...未来はまだ想像できません! (現在、AI エンジンはバージョン 3.0 に達しています)。

元のプロンプトテキスト

Midjourney を使用したことがある人なら誰でも、プロンプトに形容詞が多ければ多いほど、出力がより鮮やかでユニークになることを知っています。典型的なユーザー プロンプト「月面のタキシードを着たカウボーイ」では、次のパターンが生成されます。

9b6ab9d1c2bfbe3cbb637a5b224818fb.png

Midjourney によって生成された画像 - ヒント: 月面のタキシードを着たカウボーイ

しかし、予測可能で一貫性のある画像出力を作成するには、単純な生のテキスト プロンプトよりも多くのオプションがあります。

テキストヒントの詳細オプションを直接開くことができます。

画像バリアントを生成するいくつかの方法と、いくつかの詳細設定を次に示します (詳細な設定は以下の表に続きます)。

1. キーワードを入力します - 「スタイル」

2. 様式化する

3. カオス

4. 解決策

5. アスペクト比

6.ヒントとなる画像をURLとして渡す

7. 画像プロンプトの重み付け

8. 単語のヒントの重み付け

9. 単語のフィルタリング

つまり、スタイルは選択したキーワードによって影響を受けます。どのスタイルを作成するかを指定できます。大まかなスタイルの分類は次のとおりです。

e3e0287b63f0bd53930506ea4b955251.png

Midjourney でのスタイル分類 - 著者からの写真

1. スタイル - キーワード

「スタイル」に関連する一連の推奨キーワードを提供すると、好みのスタイルに基づいてさまざまな出力が得られます。ここでは、選択したいスタイルに基づいて、いくつかのキーワードとアート形式、デザイン、アーティスト、ジャンルを示します。

  • デザイン/ジャンルをスタイルとして使用する

9ac92d626a679786c0d478ea524a0dd8.png

著者からのヒントをもとに Midjourney によって生成された画像

  • アーティスト名をスタイルとして使用する

出力スタイルとして Artist を使用することもできます。同じプロンプトによって生成されたサンプルを次に示します。

/ アンディ・ウォーホルのスタイルで夕暮れ時に走る馬を描くことを想像してください

42ce3875c8c885e692b0118c4a938634.png

Midjourney によって生成された画像、スタイルとしてアーティスト、作者からのヒント

  • レンダリング/ライティング プロパティをスタイルとして使用する

7e9a14c41e2c2017429758b7522c3c24.png

画像は Midjourney によって生成され、プロンプト実験は著者によるものです (プロンプト テキスト: 「Dream Castle」)

2. 様式化された出力

設定 --s <何らかの番号> (スタイルを示します) を追加できます。

以下の画像は同じプロンプトに加えて、高および低スタイル化オプションを加えたものです。

/imagine firefighters --s 6000

94d8e7a731e06b608adfda6e52da6fa7.png

Midjourney によって生成された画像、ヒント: 消防士

3. カオス - 抽象化の増加

トピックの抽象化レベルを 0 ~ 100 のスケールで増減します。

/imagine Eiffel tower --chaos 60

4a0848d9f058d9c1e433300de0875ca4.png

Midjourney によって生成された画像、ヒント: エッフェル塔

4. 解決策

出力解像度を指定するには、8K、4K、リアル、超リアル、超詳細、複雑な詳細などの一般的なキーワードを選択できます。

または、予測可能な出力のために正規化することもできます。hd とquality/--q は、そのような設定の 2 つです。

/imagine red rose flower --hd
/imagine red rose flower --quality 5

5. アスペクト比

ピンチして、画像の幅:長さの比率を明示的に出力します。これをアスペクト比といいます。デフォルトの出力は正方形 (アスペクト比 1:1) です。ただし、映画のような視点が必要な場合、または単にコンピューターの壁紙にしたい場合は、アスペクト比を調整できます。

/imagine jasmine in the wild flower --ar 4:3

カスタム画像サイズを指定する場合は、次の例を使用します。

/imagine jasmine in the wild flower --w 600 --h 300

アスペクト比をカスタマイズすることはできませんが、標準的な比率と非標準的な比率を指定することはできます。(ここではいくつかの例を示します)

08733451f50cafcad36492a2902190ad.png

画像は Midjourney によって生成され、テキスト プロンプト:「Wild Jasmine」、テキストは著者によるものです

6. プロンプトとしての画像

画像のような出力を取得したい場合は、(一貫した出力が必要な場合) 画像の URL を渡します。

/imagine http://www.imgur.com/Im3424.jpg box full of chocolates

生成された画像は、シード画像 (入力した URL) とテキストヒントからヒントを得ます。

  • 複数の画像をヒントとしてアップロードできます

  • 写真のウェイトを指定できます(次の記事を参照)

7. 画像のヒントを重視する

出力をヒント画像 (上記を参照) に近づけたい場合は、この画像の重みを高くします。

(keyword : --iw <number>)
/imagine http://www.imgur.com/ks34f24.jpg chocolates --iw:4

8. テキストヒントを重視する

/imagine wild animals tiger::2 zebra::4 lions::1.5

9. 画像からテキストをフィルタリングする

--no キーワードを使用して、画像から不要な被写体を削除します。

/imagine KFC fried chicken --no sauce

ee154ed12e9bfd287aa0f979f027760f.png

10. 最後に、興味深いキーワードをいくつか試してみましょう

* Sony Alpha α7, ISO1900, Leica M, = to specify any lens type or camera type
* photorealistic , ultra photoreal , ultra detailed, intricate details, = to specify some possible details and a realistic look and less of artistic
* unreal = to specify an unreal engine feel
* volumetric light , cinematic lighting = to specify some lighting conditions

要約する

Midjourney の実験で出力画像をある程度制御する方法について説明しました。しかし、それはまだ終わっていません。想像力と実験の余地はまだたくさんあります。さまざまなヒントを試して、創作を楽しんでください。頑張ってください!

関連資料:

テキストから画像への生成における創造性 JONAS OPPENLAENDER、ヴァスキュラ大学、フィンランド https://arxiv.org/pdf/2206.02904.pdf

いくつかのテキスト プロンプトを試してみるには、次の記事を参照してください (https://pythoslabs.medium.com/lessons-learn-from-using-midjourney-v4-and-some-awesome-images-generated-text-prompts- Included- 2153dc02db4a ) には、Midjourney によって生成されたいくつかの注目すべき画像 (いくつかのサンプル画像) が含まれています。

原題:

Midjourney のプロンプトを作成するための高度なガイド (テキストから画像へ)

元のリンク:

https://medium.com/mlearning-ai/an-advanced-guide-to-writing-prompts-for-midjourney-text-to-image-aa12a1e33b6

編集者: 王晶

翻訳者プロフィール

21cde6a3ce5390f0c89a5ce8094da0b2.jpeg

Chen Chao氏、北京大学応用心理学修士、データ分析愛好家。私はかつて学部時代にコンピューターサイエンスを学び、その後、心理学の道を執拗に追求しました。学習の過程で、データ分析には幅広い用途があることがますます分かってきました。学んだことを活かして、有意義な成果を上げたいと思っています。データ スクールという大きなファミリーに加わることができて、とてもうれしく思います。謙虚な姿勢を保ち、熱心に続けてください。

翻訳チーム採用情報

仕事内容:厳選された外国語記事を流暢な中国語に翻訳する細心の注意が必要です。データサイエンス/統計/コンピュータを学ぶ留学生、海外で関連する仕事に従事している方、または外国語の運用能力に自信のある友人がいる方は、翻訳チームへの参加を歓迎します。

ボランティアの翻訳レベルを向上させるための定期的な翻訳トレーニング、データサイエンスの最前線に対する意識の向上、海外の友人と国内技術応用の開発について連絡を取り合うことができる、THUのデータベースの産学連携の背景などが得られます -調査研究はボランティアに多大な利益をもたらします開発の機会。

その他のメリット:有名企業のデータ サイエンス担当者、北京大学、清華大学、海外の有名学校の学生がすべて翻訳チームのパートナーになります。

記事末尾の「原文を読む」をクリックしてDatapaiチームに参加してください~

重版のお知らせ

転載する場合は、記事冒頭の目立つ位置に著者と出典を明記し(出典:Datapi ID:DatapiTHU)、記事末尾に目を引くQRコードを設置してください。オリジナルロゴ記事をお持ちの場合は、連絡先メールアドレスに[記事名 - 承認する公式アカウント名とID]を送信し、ホワイトリスト承認申請を行い、必要に応じて編集を行ってください。

公開後、リンクを連絡先メールアドレスに返送してください (下記を参照)。無断転載・翻案につきましては、法律に基づき法的責任を追及させていただきます。

1e9e47a23581c4e87441c69ee133a822.png

「原文を読む」をクリックして組織を受け入れてください

おすすめ

転載: blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/131496263