//=time() ?>
https://t.co/uN8hHApNKg
OpenAIが開発したTransformerベースのtext-to-image(文書から画像を生成)モデル。論文は未発表だが120億のパラメータ(GPT-3の1/10程度)をもつ。単一の物体だけでなく複数の物体も描写可能で、存在しない概念(アボカド椅子)も上手く描写できる。
https://t.co/T1F66bzXLL
顔画像をアニメっぽく変換するGAN。広いドメイン(女性全般など)を使ってBasic modelを学習させたたあとに、細かいドメイン(老人、子供、若者等)それぞれで分類器を併用しながら、各ドメインの違いを反映させるように学習させる戦略をとっている。