//=time() ?>
style2paints 2.0すごすぎる…
DeepMindがDQNなどに対し学習速度を飛躍的に向上させたNECを提案. CNNによって抽出された特徴hiとその際のQ値Qiを保存するメモリを各行動分持つ. hに類似したhiに対応するQiの重み付け和を取り, Q値を予測する. https://t.co/Rk8zklSNTu