【Novel AI 使い方】画像からイラストを生成するときの注意点

はじめに

この記事は、2023/4/2の大幅アップデート以前に書かれた記事であるので、画像から別画像を生成する(Image2Image)機能のみに着目した記事になっております。

挨拶

こんにちは、吾輩です。

インポートした画像からイラストを生成する際、思うように上手くいかなかったという経験がある方は多いと思います。

上手に生成するには、“Strength” ”Noise” という2つのパラメータの影響を理解することが重要となります。

Anlasも消費するので、できるだけ最適解がどのへんか把握しておきたいですよね。

吾輩自身も感覚で操作していたので、忘備録として記事に残しておきます。

今回の目的

  • 画像からイラストを生成する際のパラメータ設定値の影響を知る

画像から新たな画像を生成する手順

大きく4つの手順が必要になります。

  1. 画像のインポート
  2. 呪文を唱える
  3. Strength, Noiseの調整
  4. Generateボタンを押す

まずは、画像をインポートする方法を確認しましょう。

下画像の緑枠をクリックしましょう。

画像をアップロードすると、以下の画像のように表示内容が変化します。

ここで、Image2Image(i2i)を選択します(今回は元画像から別画像を生成するためこちらを選択)。

その他の項目について知りたい方は以下の記事を参照されてください。

Image2Imageを選択すると、下の画像のように、Strength, Noiseの項目が現れます。

画像から画像を生成する際、この2つのパラメータが極めて重要になります。

定義はこんな感じ。

Strength:画像の再現性。低いほど元画像に近くなる。
Noise:詳細の描画度合い。高いほど詳細が描かれる。

パラメータ設定が完了したら、プロンプトに呪文を入力しましょう(設定前でもOKです)。

呪文なしでは、イラストを生成することができません。

以上の工程の後、Generateボタンを押すと、イラストが生成されます。

生成したイラストを元画像にする場合

画像のインポートは、Novel AIで生成したイラストを使用することもできます。

生成された画面の上部に”Use as Base image”というボタンがあるので、これをクリックすると、この画像が元画像として読み込まれます。

StrengthとNoiseを変化させて検証する

早速、パラメータの影響を確認してみましょう。

今回の題材は、扱いやすさからヌオーにしました。

呪文には、”1 girl ” と使用しているので、1人の少女のイラストが生成される条件になっています。

ヌオー

Noise=0でStrengthを変えた時

Noiseを0に固定して、Strengthを変化させたときの挙動を見ていきましょう。

画像の下に記載されている数値がStrengthの設定値になります。

Strengthが0.5を超えたあたりから、人間になることがわかります。

この結果より、Strengthは高すぎてもよくないということがわかります。

Noise=0.1でStrengthを変えた時

やはり、Strength=0.6辺りで人になるようです。Noise=0と0.1の差はそれほどわかりません。

Noise=0.2でStrengthを変えた時

Noiseを上げた分、これまでの同じStrengthの画像と比較すると、詳細が描かれている結果になっています。

Noise=0.3でStrengthを変えた時

これまでと比較すると、大きく変化しています。

Noiseを高くして詳細な描画をする場合、Strengthはある程度の数値以上でないと、いびつな色合いになることがわかりますね。

Noise=0.4でStrengthを変えた時

StrengthはNoiseの値よりも高く設定する必要があるようです。

Noise=0.5でStrengthを変えた時

Strengthは0.6くらいが最適解でしょうか。

Noise=0.6でStrengthを変えた時

Noise=0.7でStrengthを変えた時

まとめ

結果を一覧にしてまとめてみました。

NoiseとStrenghtを振った時のヌオーの挙動をまとめた図

下記条件の範囲内で生成するのが、楽しくできそうです。

  • Strengthは、0.4~0.6の間
  • Noiseは、0.8以下

忘れてはいけないもう一つのパラメータ “scale”

以上、StrengthとNoiseの関係について検証しました。

複雑になるので、これまでは触れませんでしたが、もう一ついつも使用するパラメータについて、考慮する必要があります。

そのパラメータはscaleです。

scaleは、AIがどれだけ呪文を忠実に再現するかを表すパラメータの定義です。

感覚的に、scaleが低いほど線が細い風景のようなイラスト、scaleが高いほど境界のくっきりとしたイラストになります。

以下に、StrengthとNoiseを固定した条件で、scaleを変化させた場合の結果を並べています。

scaleを変化させたときの生成イメージ
scale=3

scaleを変化させたときの生成イメージ
scale=5

scaleを変化させたときの生成イメージ
scale=10

scaleを変化させたときの生成イメージ
scale=15

scaleを変化させたときの生成イメージ
scale=20

scaleを変化させたときの生成イメージ
scale=25

scaleを変化させたときの生成イメージ
scale=30

scaleを変化させたときの生成イメージ
scale=35

この結果より、scaleが高くすることは、strengthを高くすることと類似した挙動を示すことがわかります。

ただ一つ異なる点は、scaleを25以上に設定した場合、破綻したイラストが生成されやすくなるということです。scale=35では意味不明なものになっています。

では、どのように3つのパラメータを決めるかについて、

吾輩としては、線が細い/太いイラストどちらを求めるかを先に決めた後(scaleを始めに固定させた後)に、NoiseとStrengthを微調整すればいいのではないか、と思います。

個人によってやりやすさが異なると思うので、全くわからないという方は上記の方法を試してはいかがでしょうか?

さいごに

画像からの生成の際に、参考にしていただければ幸いです。

画像からイラストを生成する機能の用途については、個人によって全く異なってくるかと思いますが、下に紹介しているような使い方が一つの道です。

暇な方は是非読んでみてください。