強化学習における課題。
取りうる状態とそれに応じた行動の組数が極端に多い環境は学習しにくいことから、課題になっている。
囲碁や将棋の学習が難しい主な理由のひとつである。