AIを使って思い通りの画像を作るコツ
この投稿では、ChatGPTで狙い通りの画像を作成する方法を備忘録的に書いています。
まだまだ、ChatGPTではいい感じの画像が作れないという話も聞きますが、指示の出し方(プロンプトの書き方)次第では使えるものも多く、実際にこのサイトでもたくさん使わせてもらっています。
よかったら参考にしてみてください。
写真のようなリアルな画像
ChatGPTに「写真を作って」というと、写真は作れませんと返ってくるので、リアルな写真と見間違えるようなクオリティのものはできませんが、まあまあリアルな画像なら作ってくれます。
16:9, Realistic photo, 被写体, 構図, 背景 など
イメージの大きさを比率で最初に書いておくと、その通りの比率で作成してくれます。
何も指示をしないと、正方形だったり、長方形だったりとその都度変わってしまう場合があるので、最初に比率を支持しておいた方が無難です。
正方形の画像が欲しかったら、「1:1」と指定します。「512px:512px」のように大きさをピクセルで指定することも可能です。
例えば、「16:9, Realistic photo, a young Japanese girl, smiling, white T-shirt, white background」というプロンプトで画像を生成したら、こんな画像ができました。
ちなみに「16:9, Realistic photo, masterpiece, a young Japanese girl, smiling, white T-shirt, white background」と”masterpiece”(傑作)を追加したのが下の画像です。
髪の長さなどは違いますが、クオリティはほぼ同等です。なぜか意味不明な文字が入ってますが、よくあります。
こういう場合は、私は画像編集ソフトで消したりしてます。ChatGPTに消してとお願いしてもまた違うものができてしまうので、ここら辺が今後の課題ですね。
イラスト風の画像
イラスト風の画像には「vector illustration」を使います。ベクターとありますが、実際にはベクターデータではないので、イラストレーターなどで再編集することはできません。あくまでも「ベクターイラスト風」という位置付けになります。
16:9, vector illustration, a young Japanese girl, smiling, white T-shirt, white background
「若い日本人の女性で笑っているところ」などの条件は前と同じにしてみました。
フラットでシンプルなベクター風イラスト
flat and simple vector illustration, a young Japanese girl, smiling, white T-shirt, white background
「flat and simple」を追加しました。いくらかシンプルに描かれています。この時はあえて画像の比率を指示しなかったけど「16:9」で生成されました。
flat and simple vector illustration, icon, a business person
アイコンを作るときにもいいかもしれません。(ちょっと顔が怖い)
ラインアートスタイル
flat and simple vector illustration, line style, a business person
「line art style」は日本語にすると線画です。
使えそうなアイコン風のイラストがあります。
ピクトグラム
simple black icon, pictogram, a man, running, white background
まあまあの出来でしょう。人物の色や背景色を指定しないといろんな色で作られてしまいます。今回も背景は白と指定しているのに微妙にグレー寄りです。
アイソメトリック
”アイソメトリック”はインテリアの俯瞰図など、イメージなどを表現する場合によく使われる投影図法のことをいいます。
simple vector style, isometric, office
ピクセルアート
flat and simple 2D pixel art, a doctor
フラットでシンプルな2D(2次元)のピクセルアートのお医者さんです。
3Dイラスト
simple 3D illustration, a doctor explaining to a patient
3Dイラスト風の画像です。患者に説明をするお医者さんです。
プロンプトは英語の方が良い結果を得やすいようです。英語がわからなかったら、翻訳ツールで英語にしてコピペでOKです。
今回は、全く同じプロンプトでもう一度生成してみました。
こっちの方がいいですね。1枚目のヤツは患者と思われる左側の人物がなぜか聴診器を首からかけていて、どっちが医者かわからない画像になってしまっています。
このように一回でこちらの意図を汲み取って、的確な画像を生成するというにはまだ時間がかかりそうですが、的確なプロンプトを出してあげて、うまくいかなかったら再度生成させたり、修正するように指示することで、それなりに使えそうな画像にはなります。
これだけのクオリティのものが月3,000円程度で利用できるのであれば、かなりお得と言えるでしょう。