2024年06月06日 バンディットアルゴリズム(Bandit algorithm) 強化学習の手法。経験を蓄積するために行動する「探索」と、経験を活かして行動する「予測」を最適化する。 「G検定カンペ用語集」カテゴリの最新記事 タグ :#G検定#カンペ < 前の記事次の記事 >