//=time() ?>
それならということで、本家のCompVis
/stable-diffusionに同じプロンプトを出してみましょう。もちろん日本語で。
「鎧武者の肖像画 油絵」
ドン。
なんだろ? 飲み会風景? どう解釈したのか不明ですが日本語っぽいぞと類推したようです。なんだか楽しそうだ😆
衣装が破綻していない、背景までついてくる、頭のてっぺんからつま先まで破綻しない。
TrinArtはstepsを多め(それでも60だけど)にしないとメリットを引き出せないことがわかった。
とくかくメモリが足りないので、従来通りチェックポイント渡しにするとかしないと立ち行かないかも。
これは手と顔の当たり判定がうまくいっているようで、よく見りゃ手が物体Xな一枚。
腰で人面瘡がキスしとる。やはり画像リファイン時のimg2imgにはプロンプト不要説。