今回の目標
ハンバーガーを手で普通に持って、パクリと食べているイラストを安定して生成する
AIは何かを持つのが苦手
以前ラーメンを食べたイラストを生成した時にわかったと思いますが、AIは箸を扱ったり、手に何かを持つイラストを描くのが苦手です。タイトルの通り、まずは生成したものを見てみましょう。
ネガティブプロンプトに下記を指定 low quality, jpeg artifacts, watermark, username, blurry, missing fingers, missing arms, Humpbacked, shadow
何も考えずに食べさせてみた
ぱっと見は、女子高生がおいしそうにハンバーガーをむしゃむしゃと食べているようにみえます。
しかし、ハンバーガーの持ち方がどうやらおかしいです。バンズではなく、中身のハンバーグとレタスの間に指を入れています。
具材がかなり多いので持つこと自体難しく、このような持ち方にならざるを得なかった可能性があります。
また、それ以外にも問題があるものもありました。
左:ハンバーガーがらしくなく握りつぶしていて、何故かマスクをつけている少女
中:ハンバーガーから野菜を吸いながら?食べている少女
右:バンズを先に食べて、レタスを食べている途中の少女
まずは薄くなれば正常に持つ説を検証してみましょう。
ハンバーガーを薄くしてみた
薄くすれば、普通通りにハンバーガーを持ってくれることを期待して、thin (薄い) という単語を追加してみました。これはよくできていると思います。違和感なく全体を握っていることがわかります。
口の形が気になる
ハンバーガーを持ててはいますが、今度は口の形が気になります。そこで、動詞のeatingをbiting(噛みつく)という動詞に変更してみましょう。
下の結果をご覧ください。bitingに変更したことによって、事態は悪化しました。これでは収集がつきませんね。biting案は却下です。
いろいろ試行錯誤した
文章全体を見直したり、強調表現をいれたりしました。
要素を追加することで、うまくハンバーガーを持てなかったり、別の問題が生じてしまい難しかったです。
全部説明するのも大変なので、直接見てご確認ください(苦笑)。なかなか面白いものが多いです。キャベツとトマトを握りしめて「はいどうぞ」と言っているのはシュールです。あとは、ハンバーガーを頭に乗せてからかっているようなものもできました。苦戦している吾輩を嘲笑っているようです。
最早、数打って、うまくいったものが出るまで待機する方がよいのでしょうか?
いろいろやっているうちに誕生した、下のハンバーガー少女が好きです。吾輩がバーガー店を開くなら、この子をマスコットにしますね。
きちんと持つことをあきらめる
あきらめちゃいました。
それよりも、ハンバーガーの中身を自由自在に決めることができるのか、という疑問がわいてきて、そちらの方を検証をしてみようと思います。
ハンバーガーの中身を変更する
記載方法がわからなかったですが、とりあえず10枚のステーキのハンバーガーというニュアンスで生成してみました。結果はうまくいかず、変化なしでした。その次に、とにかく野菜を盛り込みましたが、変化見られずでした。
この結果から、hamburgerと記載した時点で、中身を指定できないのではないかと推測しました。そこで、まずはパンを用意して、そこに一つずつ具を追加できるのかを確認してみました。
パンを持つことができました。ここにお肉を挟みましょう。
Umm….なかなか理想的にはいきません。
試行錯誤の末、漸く、パンにはさまれたお肉のイラストを生成することができました(パチパチパチパチ)。
ここで知りましたが、sandwichは動詞で「挟む」という意味があるらしいです。そういうわけで、steak sandwiched with ~ という文章になっています。
上のイラストの文章を基準として、バンズの間にいろいろ挟んでみましょう!
トマトとチーズとお肉を挟むように記載しました。下の結果をみると、よくできていると思います。何かを挟むときは、sandwiched withと書いとけばよいでしょう。
ついでに
先ほどのトマトチーズハンバーガーの一枚目のイラストが妙に写真のようでしたので、realistic(写実的な)という意味合いの単語をプロンプトに追加してみました。本当に写真で撮ったようなイラストが生成されました。リアル版の検証記事もいろいろと書けそうですね。
さいごに
最後までご覧いただきありがとうございました。
イラストを大量に貼り付けるよりも、検証記事のほうが描いていて楽しいです。また面白い検証内容を思いついたら記事に使用と思うので、遊びに来てもらえると嬉しいです。
ありがとうございました。