Novel AI 大幅リニューアル!
こんにちは、吾輩です。
Novel AIが全体リニューアルされたので、使い方の理解を深めることも含め、記事に残しておきます。
前とは別物になっているので、以前の記事は参考にならなくなってしました( ノД`)シクシク…
まあ、そんなことはさておき、確認してきましょう。
主な変更点
- サイトUIの一新
- 配置変更
- Scaleの名称がPrompt Guidanceに変更
- 最大同時生成枚数の増加
- Upscale機能の改善
- ピン留め機能実装
- ControlNetの実装
上記変更点について、詳しく見ていきましょう。
公式サイトの原文をもとにしていますので、ダイジェストでない方がいい人はコチラを参照ください。
Novel AI ヘルプ→https://novelai.net/updates
1. サイトUIの一新
画面全体はこんな感じになりました。
以前は、呪文入力部が上部にあり、その他パラメータ項目が右側にあったのですが、今回の変更により、すべて左側に纏められたようです。
出力される画像は、画面の中央から右にかけて大きく表示されます。
![新しいNovel AIのUI](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
ざっくり説明
下記の画像のように配置が変更されています。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
呪文部分
プロンプトとネガティブプロンプトが、タブで切り替えられるようになっています。
〇の枠を押すと、どちらも固定されてわかりやすくなります。
Prompt : 生成したいものを記載
Undesired Content : 生成したくないものを記載
![PromptとUndesired Content](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Steps, Scale, Seed, Sampler
これまで使用していた Steps, Scale, Seed, Sampler の設定場所は、出力ボタンの少し上に配置されています。
Scaleは、Prompt Guidance(正確度)という名前に変更されました。
SeedとSamplerは▼ボタンを押して展開しなければ入力できなくなりました。
![Steps, Prompt Guidance, Seed, Sampler](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
手打ち入力も可
Steps, Prompt Guidanceは、スライダーを移動することで設定できますが、直接数値を入力することもできます。スライダーの限界値よりも大きくしたい場合、手打ち入力が必要になります。
Prompt Guidanceを大きくした時の問題が解決
Prompt Guidance(元々はScale) は、大きくすると変な画像になることが問題でした。
Prompt Guidanceの右側にある、Decrisperという項目をONにすることで、この問題を解決することができるようになりました。
生成枚数
これまでよりも、一度に多くの画像を生成できるようになりました。
ただし、Anlasという有料ポイントの消費量も増加します。
Upscale
出力された画像の解像度を上げる場合に使用します。
これまでよりも、機能が向上されたとのことです。
生成された画像の上にあるボタンを押すことで、新たに高解像度の画像が出力されます。
![Upscaleの方法](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Upscaleする前後の品質を比較してみました。
左:Original
右:Upscale
![Upscale前](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Upscale後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?resize=512%2C768&ssl=1)
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?resize=1140%2C1710&ssl=1)
ピン留め機能実装
これは残しておきたい、と思った画像はピン留めできるようになりました。
画面下の画鋲マークを押すとピン留めされます。
![ピン留めの方法](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
ピン留めすると、下の画像のようにピン留めされたイラストをいつでも呼び出せるようになります。
大量に画像を出力すると、右のHistory欄に記憶しておきたいものが埋もれますが、ピン留めされたイラストは、即座に呼び出すことができます。
![ピン留め後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
上の画像では、左端にアイコンが現れます。
それぞれ下記の役割を果たします。
一番上:ゴミ箱
真ん中:呼び出す
一番下:シード値をコピー
![アイコン](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
吾輩が確認した限りだと、ピン留めは1枚のみしかできないようです。
新たにピン留めすると、古い方のピンは外されました。
2. ControlNetの実装
こちらが、今回のアップデートのコアな部分です。
ControlNetは、読み込まれた画像を基に新たな画像を生成する時(image to image)に役立ちます。
ControlNetの実装により、読み込んだ画像の構造読み取り精度が各段に向上するようです。
言い換えれば、所望の画像を得やすくなったということです。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
具体的にできるようになったこと
- 画像を基に別イラストを生成
- 色を変更
- 3D画像の構図を取得し、新たなイラストを生成
- 2D画像の構図を取得し、新たなイラストを生成
- 直線部分を読み取り、建物を生成
- 形状を読み込み、風景を生成
以下に公式ヘルプから引用した画像を掲載します。
1.画像から画像を生成(これまで通り)
![Image2Image](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
2.色を変更
![Palette Swap](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
3.3D画像の構図を取得し、新たなイラストを生成
![Form Lock](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
4.2D画像の構図を取得し、新たなイラストを生成
![Scribbler](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
5.直線部分を読み取り、建物を生成
![Building Control](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
6.形状を読み込み、風景や構造物を生成
![Landscaper](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
実際に確認しよう
画像ばかりをみても、わからないことも多いと思うので、吾輩と一緒に見ていきましょう。
あとは、生成したいものを呪文で唱えましょう。
1.画像から画像を生成
![Image2Image](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
この機能は以前から存在する機能ですが、パワーアップしたと書いています。
Image2Imageでは、StrengthとNoiseの設定が重要になります。
これらの設定値については、過去に書いた以下記事で説明していますので、詳しくはこちらを確認ください。
これ以降が新たに追加された機能になります。
2.色を変更
![Palette Swap](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Palette Swapは、読み込んだ画像のフレームを読み込み、フレームの内部の配色を変更する機能です。
少女の画像を読み込んで、Palette Swapを選択しましょう。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
すると、驚くべきことに、一瞬で読み込んだ画像の境界線が表示されました。
下の画像のように画面に表示されます。
![Palette Swap選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
この状態で、Generateボタンを押すと生成されます。
とても簡単ですね。
左上:オリジナル
その他:Palette Swap後
![Palette Swap後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Palette Swap後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Palette Swap後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Tool Influenceで影響度を選択できるようで、高いほど元絵を反映するようです。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Add More Detail?からも、細かく生成する色のパラメータを調整できるようです。
今回は割愛しますが、別の記事で検証してみます。
![詳しいパラメータの設定方法](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
3.3D画像の構図を取得し、新たなイラストを生成
![Form Lock](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
再び少女のイラストを読み込んだ状態で、Form Lockを選択します。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
すると、下のようにのっぺらぼうが表示されました。
白、灰色で色分けされていますが、この差が奥行を表しているのでしょう。
二次元イラストからこの奥行きを把握できるとは、革命的なシステムです。
![Form Lock選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
このまま、恐る恐るGenerateボタンを押しました。
左上:オリジナル
その他:Form Lock後
![Form Lock前](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
色が変わりましたが、それもそのはず、呪文を変えていないためです。
お爺さんを生成するようにした結果がこちらです。
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
こちらは見なかったことに。
4.2D画像の構図を取得し、新たなイラストを生成
![Scribbler](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
こちらは、先ほどとは異なり画像を奥行きのないものとして認識するようです。
![](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Scribblerを選択すると、こんな感じになりました。
![Scribbler選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
ラフに描いた落書きのような感じになっています。
この状態で、生成された結果が以下になります。
左上:オリジナル
その他:Scribbler後
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Form Lock後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
結果に多様性があることがわかります。
少女の胴体部分は、読み込み時の線がごちゃごちゃとしているため、生成するたびに異なるデザインのイラストが生成されました。
5.直線部分を読み取り、建物を生成
![Building Control](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Building Controlは、背景を生成する時に使用します。
背景でなくとも、直線で構成される無機物は使えると思います。
読み込んだ画像の直線部分を、建物の概形として認識し、あらたなイラストを再構築できるようです。
題材の女の子は、題材的に相性が悪いので、新たにこちらの画像を用意しました。
![題材の風景](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Building Controlを選択すると、下記画面になり、ビルの部分が線で描かれています。
この結果では、線が元の写真に対して少ないことがわかります。
![Building Control選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Settingを押すと、以下の2項目が表れます。
少しいじっただけでは把握できなかったので、こちらも別記事で確認します。
![Building Controlのパラメータ設定](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
呪文の摩天楼(Sky scraper)を使用して生成されたイラストが以下になります。
左上:Original
その他:Building Control後
![Building Control前](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Building Control後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Building Control後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Building Control後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
完成度が高すぎて、最早どの画像が原形が分からないほどです。
呪文にnight, rainなどを使うことによって、天候や朝夜を調整できます。
6.形状を読み込み、風景や構造物を生成
![Landscaper](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Landscaperは、形状を把握するということで、Building Controlの少し詳しい版のような位置づけになるような印象です。
Landscaperを選択すると、このような結果が得られます。
![Landscaper選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
呪文を少しずつ変えて、生成したものが以下の画像になります。
左上:Original
その他:Landscaper
![Landscaper選択前](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Landscaper選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Landscaper選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
![Landscaper選択後](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)
Building Controlよりも精度が高い結果になりました。
どのようにLandscaperとBuilding Controlを使い分けるかは、使いながら確認していこうと思います。
さいごに
内容がモリモリになってしまいましたが、表面的な説明しかできていないところは、別記事で補足しますので、もうしばらくお待ちください。
長々と最後まで読んでいただいた方は、ありがとうございました。
それでは、良い一日を。
![少女](https://i0.wp.com/imashime-trading.net/wp-content/themes/the-thor/img/dummy.gif?w=1140&ssl=1)