//=time() ?>
もしかしてポーズ集に色塗ったら結構いい感じになる? ということでmspaintで色を塗って(下手くそ…) strength=0.8でimg2img
ややっ、結構意図通りの構図になってないか…?
#stablediffusion
元絵の左肘のところに変なもんがついてるのをimg2imgにそのままかけたら結構な確率でそのまま採用されるようだ、要らないものは消そうということでmspaintで消して… で再度img2imgかけるとちゃんと消えてくれるな こりゃあリテイクが捗るでしかし
#stablediffusion
Stable Diffusion の img2img を使えるようにしたので、txt2imgで出力した絵を同じpromptでimg2img再出力、というのをやっている
1枚目がtxt2imgで出したやつ、2~4枚目がimg2img
微妙な違いが面白さを生むなぁ
#stablediffusion
さっきのはstrength=0.5, 0.8にするといやー元の絵の要素ほとんど無視しよる、ていうかこれ画伯(=prompt)あんたの趣味やん!!! 爺さんこんなに頑張ってるのに無視しないで!
#stablediffusion
とりあえず自分は絵を描けないので… 前に出力した白髭の老ウィザードを突っ込んでみた
おお… 爺さんが美魔女に… いや美魔女は意味が違うか
#stablediffusion
うーん、でも速度は題材を「サイバーパンクと女性」に変えると横長1枚22秒~1分に増える&バラツキが出るぞ なんだろなぁ、GPUもフルで回ってない感じがするしどこにボトルネックができるんだろう?
#stablediffusion
正方形(512x512)、
傾向としては縦長の出力に似ている、縦長の出力を上下切り取った感じ? しかし横長の構図に似ているものも見られる
バストアップ多め、クローズアップも見られる
横長(768x512)、
バストアップも多くなる
1つの絵の中に2人描かれる確率が非常に高い
背景が描かれる絵が多い
縦長に比べて顔が崩れる絵が多くなる
顔崩れが多くなるのは気になるなぁ、背景込みの学習データがノイズになるんだろうか?
同じプロンプトでもキャンバスが縦長か横長かで構図に違いが出てくるか試した (200枚出力)
まず縦長(512x768)、ウエスト、膝丈、全身の姿が描かれることが多い
背景はあまりない
顔の崩れはすくない
#stablediffusion
しかしひたすらreddit で拾ったコレをベースに prompt をいじりまくってるんだけど、うーんやっぱこのpromptが完璧すぎて困るんだよなぁ… 他の構図を描かせると顔に雑味が増す感じになってしまう(男を除いて)
#stablediffusion
https://t.co/t68Yqbbncs