決定木がデータを分割する上での目標は、情報の利得が最大になるような特徴量としきい値の組み合わせを最適化することである。
データを分析した際に1つのノードの中のデータクラスの不純度が低くなれば、利得の値が大きくなる。