2022年10月27日 ベクトル空間モデル 自然言語処理において、ベクトル間の距離や内積などから文章の意味を表現するモデル。文章中の単語の重要度を利用して文章をベクトルとして表現し、文章同士をそのベクトル空間上で比較することによって、2つの文章間の類似度を計算するという考え方の計算法。 単語の重要度を使って文章を数値化して比較する。 タグ :#G検定#カンペ
2022年10月26日 マルチエージェント強化学習(multi-agent reinforcement learning:MARL) 複数の強化学習エージェントが同時に学習をして行動し、相互に影響を与える、自立分散型の学習フレームワーク。 タグ :#G検定#カンペ
2022年10月25日 ノイジーネットワーク(noisy network) DQNでは、常にその時点で価値の高い行動をとり続けた場合、別の行動をとる可能性がなくなってしまう。この問題点をネットワークそのものに学習可能なパラメータと共に外乱を与え、それも含めて学習させていくことでより長期的で広範囲に探索を進めることで、改善するという方法。 タグ :#G検定#カンペ