2023年07月19日 強化学習の技術進歩 DQNを拡張させた手法もいろいろある。有名なのはダブルDQN(DDQN)やデュエリングネットワーク、ノイジーネットワークなど。さらにこれらのアルゴリズムの良い特徴を組み合わせた「全部のせ」モデルがRAINBOW。Atariのゲームを使ったテストでは他のすべての手法に勝るパフォーマンスを示す。 「G検定カンペ用語集」カテゴリの最新記事 タグ :#G検定#カンペ < 前の記事次の記事 >