モデルのアーキテクチャそのものを最適化する理論。
Auto MLの背景にある。
強化学習のアーキテクチャを応用している。
(ニューラルネットワークの構造自体がパラメータと重みを最適化する。)
パラメータ最適化の全段階であるネットワーク構造の最適化も行う。
(1)Controller RNN が設定した Child Networkのハイパーパラメータで Child Netword を学習。
(2)学習後の Child Network で検証データに対する Accuracy を Controller RNN の報酬とする。
(3)この報酬を元に、方策勾配法によって Coltroller RNN を更新する。
膨大な計算量が必要である点が改善点である。