//=time() ?>
学習用にTwitter から18万枚集めたのだが、実は、キャプションをつけられているのは8000枚程度しかなく、U-Netはこの8000枚程度しかまだ学習されていない。見込みでは数十万枚、あるいは百万枚以上集まるため、こいつLatent Diffusion の時点でどうなるのこれと言う気持ちになっている。
ファンタジーなスクリプトを自動生成したら、確かにファンタジーっぽくなった。プロンプトジェネレーターに何を入れるかでだいぶ傾向が変わるな。学習を偏らせているが、ある程度は網羅しなければ。
朝になりました。昨夜は微細な表現の強化を行いました。すると、小さな目がうまく表現できるようになってきました。どうしてくれるんでしょうか。言い方を悪くすると、これらは改良型Imagen の餌です。ただの餌です。なんと言うことをしてくれるのでしょう。