2024年06月10日 ε-greedy法 強化学習において、単なるgreedy方策ではさらに良い方策がないのかを探索できないため、一定の確率ε(イプシロン)でランダムな行動をとるようにさせたもの。バンディットアルゴリズムの具体的な手法にあたるのがε-greedy法である。 「G検定カンペ用語集」カテゴリの最新記事 タグ :#G検定#カンペ < 前の記事次の記事 >