ChatGPT Plus 経由の DALL-E 3 は、自己生成されたプロンプトから正確な画像を作成することに優れていますが、MidJourney はさらに芸術的です。 ChatGPT からのプロンプトと最新の MidJourney イメージ モデルを組み合わせることで、両方の長所を活用できます。
MidJourney で DALL-E 3 プロンプトを使用する理由
DALL-E 3 は、正確な構成で特定の画像を簡単に作成するのに最適ですが、MidJourney と比較すると、ある種の芸術的および視覚的なセンスが欠けています。これは、2 つのイメージ ジェネレーター間で同じプロンプトを使用しており、両方のイメージ出力を直接比較できるため、以下で簡単に確認できます。確かに、どちらが優れているかは意見の問題ですが、DALL-E 用に ChatGPT によって生成される詳細なプロンプトが、ほとんどの人が MidJourney 用に思いつく貧血プロンプトよりもはるかに優れていることにはほとんど議論の余地がありません。同じプロンプトを使用して、左側の DALL-E 3 と右側の MidJourney の違いを考えてみましょう。
プレーンバニラ ChatGPT (無料版と有料版の両方) でプロンプトを生成しようとしましたが、MidJourney で使用するプロンプトは作成されますが、それらのプロンプトは特殊な DALL によって作成されたプロンプトほど優れたものではないようです。 ChatGPT の -E モード。これが単にプラセボ効果が作用しているのかどうかはわかりませんが、より良い画像を生成するために OpenAI が ChatGPT のこのモードで微調整を行ったであろうことは当然です。
ChatGPT での DALL-E 3 の仕組み
DALL-E 3 からこれほど優れたプロンプトが得られる理由を理解するには、ChatGPT と DALL-E 3 を使用して画像を生成する仕組みと、MidJourney との違いを簡単に説明する必要があります。
MidJourney では、画像ジェネレーターに直接「プロンプト」を入力します。 MidJourney AI モデルは、これらの単語を取得し、「拡散」として知られるプロセスを通じてそれらを画像として描写しようとします。プロンプトの正確な文言や構造を少し変更しただけでも、最終結果に劇的な影響を与える可能性があります。これが、「 プロンプト エンジニアリング 」の技術が普及し、一貫してより良い画像を生み出すプロンプトの表現や発見のコツを持っている人がいる理由です。
ChatGPT 経由で DALL-E 3 を使用する場合、コントロールはそれほど直接的ではありません。画像に何を描写したいのかを ChatGPT に説明しますが、DALL-E 3 に送信される実際のプロンプトは ChatGPT によって作成されます。
これは、AI チャットボットがプロンプト エンジニアの仕事を引き継ぐことを意味し、MidJourney でそのプロンプト エンジニアリングの能力を活用する機会が得られます。
ChatGPT の DALL-E 3 プロンプトを MidJourney に移植
DALL-E 3 が要求された画像を作成するために使用した実際のプロンプトがどこにあるのかはすぐにはわかりませんが、結果にある画像の 1 つをクリックしてギャラリーを開くだけです。
画像の右側にはプロンプトがありますが、プレビューではすべてが表示されない可能性があります。プロンプトの下にある「コピー」ボタンをクリックしてクリップボードにコピーします。
次に、MidJourney で、 通常プロンプトを入力する Discord にプロンプトを貼り付けます。 MidJourney 固有のパラメーター ( アスペクト比 など) を追加し、AI に指示を送信します。
次に、結果をお楽しみください。
DALL-E 3 が ChatGPT で生成する (最大) 4 つの画像にはそれぞれ独自のプロンプトがあるため、自分の好みに応じて最良の結果が得られたものを使用してください。
これまでのところ、DALL-E 3 には非常に感銘を受けていますが、MidJourney のサブスクリプションをキャンセルする準備はまだ整っていません。 DALL-E 3 から特に優れたプロンプトを受け取るたびに、私はそれを MidJourney で実行して、控えめな AI アーティストが同じ指示で何を調理するかを確認します。





