人気の AI アート ジェネレーターである Stable Diffusion では、画像を作成するためにテキスト プロンプトが必要です。時々、それは素晴らしい仕事をし、曖昧なプロンプトであなたが望むものを正確に生成します。また、最適とはいえない出力が得られることもあります。理想的な結果を得るためのヒントとコツをいくつか紹介します。
安定した拡散プロンプトを作成する方法
Stable Diffusion、DALL-E、 MidJourney などの AI 画像ジェネレーターを少しでも使ったことがある人なら、適切な言葉で書かれたプロンプトが重要であることに気づくでしょう。適切な言葉でのプロンプトは、あなたのアイデアを素晴らしい画像に変えるか、あまりにも多くの指があなたを見つめ返す不気味な谷のような怪物になるかの違いです。
2022 年 8 月に Stable Diffusion が開始されて以来、人々は理想的な結果を得る最良の方法を模索し続けており、今後何年にもわたって「即時鍛冶」または「即時エンジニアリング」になるでしょう。 Stable Diffusion がイメージを生成する方法を通知するチェックポイントが定期的に更新されるため、その可能性は特に高くなります。理想的なプロンプトは、近い将来、動く目標となるでしょう。
更新: 2022 年 12 月 23 日
このアップデートの時点での Stable Diffusion の最新バージョンであるバージョン 2.1 は、否定的なプロンプトに対して非常によく応答します。否定的なプロンプトは通常のプロンプトと同じですが、必要なものを説明する代わりに、必要でないものを説明します。否定的なプロンプトを含まない最初の画像セットを生成してから、否定的なプロンプトを追加して気に入らない要素を削除してみてください。
できるだけ具体的にする
Stable Diffusion は、特に MidJourney のようなものと比較した場合、特定のプロンプトで成功する傾向があります。あなたが望むものを正確に伝える必要があります。ここでは、インターネットで人気の動物であるかわいい猫を使用した例を示します。
まあ、彼らはかなりかわいいですが、おそらく彼が深淵を見つめるのにあまりにも多くの時間を費やしたように見える中の上の可哀想な男を除いて。しかし、猫のミックスではなく、灰色の猫が欲しい場合はどうすればよいでしょうか?そうですね、それを指定する必要があります。代わりに「かわいい灰色の猫」をプロンプトとして使用してください。
安定拡散はすべての灰色の猫を返すようになりました。写真内の猫のアクセサリーなど、必要なものの説明を追加し続けることができます。
これは、風景を含め、Stable Diffusion で生成したいものすべてに当てはまります。説明的なものにして、キーワードのさまざまな組み合わせを試しながら、画像がどのように変化するかを心に留めておいてください。一部の単語やフレーズは他の単語よりもイメージに強いバイアスをかける傾向があるため、それに応じてプロンプトを調整する必要がある場合があります。
特定のアート スタイルまたは媒体に名前を付ける
具体性の必要性は、必要な画像の内容を完全に説明しても終わりではありません。必要なスタイルを指定することもできます (また、指定する必要があります)。これについては、「かわいい灰色の猫」というプロンプトをそのまま使用します。かわいい灰色の猫が欲しいとしますが、同時にアクリル絵の具のように見せたいとします。最初に試すべきことは、プロンプトの次のキーワードとして「アクリル絵の具」を追加して、「かわいい灰色の猫、アクリル絵の具」と表示されるようにすることです。
一般に、希望するものに近づくために最小限のキーワードから始めて、探している美学を明確にするためにキーワードを追加するのが最善です。
安定した拡散により、鉛筆画からクレイ モデル、Unreal Engine の 3D レンダリングに至るまで、 あらゆるスタイルが 数十種類認識されます。
これらのプロンプトの例は非常に単純ですが、多数のキーワードを使用して結果を微調整できます。ウォルマートで奇妙でサイケデリックな色の粘土の鶏のモデルが欲しい場合は、これらの条件をすべて指定する必要があります。
安定した普及を導くために特定のアーティストの名前を挙げる
Stable Diffusion は、特定のスタイルやメディアをエミュレートするだけではありません。必要に応じて、特定のアーティストを模倣することもできます。この例ではパブロ ピカソを使用しました。
プロンプトに「by (アーティスト名)」をまだ入力していない場合は、必ず入力してみてください。劇的な結果を生む傾向があります。通常は組まないようなアーティストを組み合わせるのも恐れることはありません。多くの場合、Stable Diffusion はそれぞれのスタイルをエキサイティングで予測できない方法で組み合わせます。
私たちが推奨する Windows 用 Stable Diffusion の GUI バージョンを使用している 場合は、プロンプト ウィンドウの右側に「ロール」ボタンがあり、アーティストをプロンプトにランダムに表示します。新しいスタイルに出会うのに最適な方法です。
キーワードに重み付けをする
もちろん、プロンプトにキーワードを詰め込むだけでは限界があります。プロンプトに正しい情報がすべて表示されているにもかかわらず、それらのバランスが適切でない場合はどうなるでしょうか?
Stable Diffusion は、プロンプト キーワードの重み付けをサポートします。言い換えれば、特定のキーワード (複数可) に実際に注意を払う必要があり、他のキーワードにはあまり注意を払う必要がないことを伝えることができます。探している結果はある程度得られているものの、十分ではない場合に便利です。
Stable Diffusion のコマンドライン バージョン では、強調したい単語にフル コロンとその後に続く 10 進数を追加するだけです。小数はパーセンテージなので、合計すると 1 になる必要があります。
「かわいい灰色の猫」プロンプトに戻って、かわいい猫が正しく生成されていたが、出力画像には灰色の猫があまり含まれていなかったと想像してみましょう。プロンプトを変更して、代わりに「cute, grey cat:0.7」と表示すると、灰色の猫に最も注意が払われ、その差が「cute」に自動的に適用されます。より細かく制御したい場合は、プロンプト内の各単語に手動で重みを割り当てることもできます (たとえば、「Cute:0.10、Gray Cat:0.60、Unreal Engine rendering:0.30」など)。
安定拡散で使用できる GUI のほとんどは、明示的なパーセンテージを入力することなく重み付けを処理します。通常、プロンプト内の用語の周囲に括弧を追加して強調したり、括弧を追加して用語の重要性を下げることができます。したがって、前の「かわいい、灰色の猫」は、「[かわいい],((灰色の猫))」のように見えるかもしれません。
複数の括弧を使用して、必要に応じて強調を重ねることができます。
他の場所でインスピレーションを見つける
Stable Diffusion やその他の AI アート ジェネレーターは、爆発的な人気の急増を経験しました。この種の AI アートはいたるところで見つけることができます。つまり、現在、ユーザーが作成した画像が少なくとも数百万枚インターネット上に流通しており、ほとんどの場合、結果を得るために使用したプロンプトが含まれています。
何を作成したいかわからない場合に、インスピレーションを刺激するのに役立つリソースをいくつか紹介します。
これらはすべて潜在的に NSFW で ある可能性があります。
- Lexica — Stable Diffusion を使用して生成された画像のリポジトリと、対応するプロンプト。キーワードで検索可能。
- Stable Diffusion のアーティスト スタイル 研究 — Stable Diffusion が認識する可能性のあるアーティストの非網羅的なリストと、その芸術スタイルの一般的な説明。 Stable Diffusion がプロンプトの一部としてアーティスト名にどの程度反応するかを示すランキング システムがあります。
- Stable Diffusion Modifier Studies — アーティスト ページと同様に、Stable Diffusion で使用できるモディファイアのリスト。
- AI アート モディファイアのリスト — プロンプトで使用できる最も強力なモディファイアのいくつかとその機能を紹介するフォト ギャラリーです。モディファイアのタイプごとに並べ替えられています。
- 安定拡散で代表される上位 500 アーティスト — 安定拡散トレーニング セットにどのような画像が含まれているかを正確に知っているため、どのアーティストが AI のトレーニングに最も貢献したかを知ることができます。一般に、トレーニング データ内でアーティストがより強く表現されていればいるほど、安定した拡散はキーワードとしてその名前に応答します。
- 安定した拡散のサブレディット — 安定した拡散のサブレディットには、新しいプロンプトや楽しい発見が絶えず流れてきます。インスピレーションや洞察を求めているなら、間違いはありません。
その他の重要な設定を調整する
適切なプロンプトを作成することが安定した拡散を使用する上で最も難しい部分ですが、結果を劇的に変える設定が他にもいくつかあります。
- CFG: 安定拡散がプロンプトにどの程度強く従うかを決定します。数値が大きいほどプロンプトへの忠実度が高まり、数値が小さいほど AI の自由度が高くなります。まずはこれを微調整してみてください。
- サンプリング方法: 画像をノイズから認識可能な形状に精製する方法。これらをいくつか試してみてください。 Euler_a、k_LMS、および PLMS が一般的な選択肢のようです。
- サンプリング ステップ: 最終結果が得られるまでに画像がサンプリングされる回数。 30 ステップで良い結果が得られる場合もありますが、50 または 80 ステップに進む必要がある場合もあります。通常、150 ステップを超えるとより良い結果は得られません。少ないステップから始めて、ステップを上げてください。
私たちのお気に入りの定型化されたプロンプトのいくつか
これらは非常に確実に機能する傾向があるため、私たちのお気に入りのプロンプトの一部です。選択した主題といくつかの修飾子をドロップするだけです。他のすべての安定拡散設定は、上記のプロンプトと同じに保たれました。
一般に、安定拡散は夕日と紅葉を非常にうまく作成します。
(被写体)、35mm、シャープ
被写体を選択すると、このプロンプトにより、人物、動物、風景の写実的な結果が確実に返されます。
このプロンプト例には、夕日の色を取得するための「Golden Hour」も含まれています。
「素晴らしい安定した拡散プロンプトを作成する方法」に関するベスト動画選定!
(主題)、低ポリ 3D レンダリング、鮮やかなパステル カラー、チルト シフト、フィルム グレイン
主題を入力すると、「Art of Rally」の美学が得られます。
(主題)、(環境の説明)、映画的、劇的、構図、晴れた空、ブルータリスト、超現実的、壮大なスケール、畏怖の念、ハイパーマキシマリスト、常軌を逸したレベルの詳細、アートステーション HQ
件名と環境の説明を入力するだけで、このプロンプトにより、選択した環境効果を備えた素晴らしい都市コンセプト アート画像が提供されます。以下は、ニューヨーク市を主題として、砂嵐を環境の説明として使用した例です。
カーミットなんでも
安定した拡散は、Kermit で素晴らしい結果をもたらします。どこでも試してみてください。
Stable Diffusion が「モルドールのカーミット」をこのように解釈するのはなぜですか?また、私たちの屈強なヒーローの後ろに立っている赤い邪悪な存在、カーミットは誰ですか?わかりません。
重要な用語と思われるものをプロンプトから削除することを恐れないでください。 「ゴージャス」などの特定の単語は、正確な意味を持たない場合でも、画像の見た目に大きな影響を与えます。 Stable Diffusion を使用する時間を増やすと、Stable Diffusion が特定の単語にどのように反応するかの感覚が養われ、優れたプロンプトを書くこと自体が芸術であることがすぐにわかります。





