2023年05月19日 動的計画法 価値ベースのアルゴリズム。モデルのパラメータが既知の場合に、Bellman最適方程式を解いて最適な方策を得るアプローチ。 「G検定カンペ用語集」カテゴリの最新記事 タグ :#G検定#カンペ < 前の記事次の記事 >