//=time() ?>
Self-Distilled StyleGAN [Mokady+, 2022]
Web上の画像でGANを訓練する際の課題は外れ値と多峰性である。自己蒸留によるデータの選別とWのクラスタ中心へのtrucationによって従来よりも多様なデータセットで高品質な画像生成を可能にした。データセットも公開。
https://t.co/Kika7V6uEc
#NowReading
Jukebox [Dhariwal+, 2020]
DilatedConvの階層VQ-VAEとSparse Transformerの事前分布により、多様なジャンルの音楽の数分間に渡る波形を直接生成することに成功した。歌手や歌詞で条件付けることもでき、自然に発声される。数十億パラメータの複数のモデルを120万曲で訓練。
https://t.co/eTeCg2bOnv
Great painters x Pokemon harmonized by #SinGAN.
Left: Ito Jakuchu x Ho-oh
Right: J. M. W. Turner x Lugia