//=time() ?>
STYLE-GANNが繰り出した左の絵をIMG2IMGでどうにかしようと頑張ったんだ。
けど箸にも棒にも掛からくてさ。
そんならプロンプト解析して書き直してやれ!って
IMG2PROMPTにかけるという荒業つかって見事に達成した。
えっへん<(`^´)>
一晩放置してたstable diffusion、
簡単なprompt2imgでほしい要素の入った画像を生成して人間がマシなものをpickup、それぞれをimg2promptでmodel側の表現にして再度prompt2imgしたものがこちら。
もとのpromptはチープだったけど再生成することで150~300文字くらいのpromptを生成できてた
ミクさんを渡してもOutputにミクに関する語彙は出て来ないね
CGアーティストの中井翼さんのレンダリングって出てきたw 勉強になる
LAION-5Bのデータには初音ミク結構あるんだけど、#img2prompt はちがうデータなんかな🤔
出力候補100個ぐらい出してってソース改造する?
https://t.co/SEWpP5YQVW
#img2prompt イイ(≧∇≦)b
画像から呪文の詠唱方法を教えてくれるw
#暗殺貴族 でルーグが魔法を生成しちゃう感じ?
4枚めで得られた呪文を入れてみた→1枚め~3枚め
学習データのLAION-5BにVivy無いからVivyはムリ😢
モデル依存性高い
#stablediffusion #VisionTransformer
https://t.co/yZJjO0h5gM