//=time() ?>
唐突な人力画像生成
「"上手い絵"は我々に任せなさい」と囁かれた気がしたので、これからは絵を描くことそのものを楽しむ方向で行こうかと思います。
60分くらいでサクッとラクガキすることの楽しさを覚えました。
#初音ミク
768のdreambooth試してる。
必要な計算コストが多分倍以上になってるので、16枚のtrain画像に対して1600ステップは全然足りてないのかな?
学習速度はT4のbatch_size=1で1.78s/itくらい。
普通にbaseに対して性能が劣っているという可能性もあるけど、もうちょっと検証を進めたい。
なんかキャラの再現度高くないか?
一瞬左右反転やトリミングを組み込んだi2iかなとか思ったけどどうなんだろう。ポーズが固定されてるのが気になる。
一枚目: 猫耳、女の子、14mm Lens、f0.95、高品質、高画質
二枚目: <一枚目の画像のurl> 猫耳、女の子、14mm Lens、f0.95、高品質、高画質
Nijiのimage promptで一度生成したキャラクターを蘇らせる実験をしている。
image promptって画像の雰囲気を何となく維持するだけ、という印象だったけど、髪の色とか猫耳とかまでしっかり残ってるようだ。
なんで?
1枚目: 猫耳 白い髪 女の子
2枚目: [左上の画像のurl] 馬に乗っている 女の子
Inkpunk-Diffusion結構好き
"nvinkpunk a girl playing guitar"
https://t.co/RXiL9vkbwz