WaifuDiffusion 検証 Step CFGScale Sampler編

前提条件

使用する呪文は以下の通り。Negative promptを使うので再現したい方はStableDiffusion WebUI/AUTOMATIC1111推奨です。

prompt: excellent professional bishoujo anime kawaii cute moe 1girl full body blush smile long (blonde) hair bangs light blue eyes (dress) wind outdoors

Negative prompt: part of the head mutated hands and fingers deformed blurry bad anatomy disfigured poorly drawn face mutation mutated extra limb ugly poorly drawn hands missing limb blurry floating limbs disconnected limbs malformed hands blur out of focus long neck long body photo photograph photography pablo picasso chibi loli

次に設定は以下の通り、検証内容ごとに各値が変動しますのでご留意ください。

Step: 30, CFGScale: 10.0, Sampler: Euler a, Width: 512, Height: 512

Step編

では早速Stepから。特定SeedでStepのみ変動させて結果を見てみます。



普段Step50でやってたのでこの結果には結構驚きました。Step50で悪いということはないのですが、Step30で十分なクオリティが出せています。上記の結果を踏まえて今度はStep10~30にフォーカスを当ててみます。


イメージ的にはStep15でも完成する絵はあるけど、Stepo30にしておけば大半の絵が完成するって感じでしょうか。Step15で一気に処理を走らせて良さそうなSeedを見つけたらStepを上げてみるという人もいるそうです。確かにこれならStep15で判断できそうですね。


CFGScale編
お次はCFGScaleです。Stepは冒頭で触れたように30にしています。


これも差がありますが、Stepほどではないですね。気になるのは呪文でfull bodyと入れてあるのに何故かCFGScaleが上がるとポートレイトっぽくなることです。解像度が低い影響もあるとは思うのですが、CFGScaleが上がるほど呪文に忠実になるはずでは…?謎です。

気を取り直して次はCFGScale7.5~12.5の範囲で見てみます。 



大体この範囲で極端な差がないので、この中からお好みでよさそうですかね。もっと複雑で長い呪文だともっと影響が強いのかもしれません。


Sampler編
お次はSamplerです、CFGScaleは10.0に戻しています。


いつも使っているのはEuler aで、こうしてみるとそれぞれ結構特徴がある感じでしょうか。大きく分けるとするならEuler a、DPM2 aのコンビとそれ以外って感じにも見えます。しかしDPM2 aはEuler aに似ているけど描写が怪しい。

確かStepによってSampler毎の特徴が出やすくなると聞いたので、今度はSeed1でStepを変化させてみます。


DPM2 aは最低Step50以上ないと駄目そうです。Euler aはStep50で頭打ちみたいな感じ、それ以外もちょっとディテールが上がってるかな~ぐらいなので好みになりそうです。

もうちょっと詳しく見てみたいので今度はStep15~50で変化を見てみます。


DPM2 aとPLMSはStepが低いと厳しい、それら以外は15で大まかな全体像が出来上がってるように見えますね。後はSampler選びも好みで良いのではないでしょうか。

やはりStep15でSeedガチャをするのが効率良さそうです。もちろんガチャせず最初から30や50くらいで回しても面白いです。


このブログの人気の投稿

Danbooruは本当に違法転載サイトか?

WaifuDiffusion 検証 イラストその他スタイル編