AlexNetと同様に畳み込み層とプーリング層を重ねた典型的な
CNNだが、AlexNetよりも層が深い。
重みがある隠れ層(畳み込み層や全結合層)が16層あるモデルは「VGG-16」、隠れ層が19層あるモデルは「VGG-19」と呼ばれる。
当時は、大きいフィルタで画像を一気に畳み込むよりも、小さいフィルタで何度も畳み込む方がよく特徴を抽出できると知られていたため、VGGでも小さなフィルタを使った畳み込み層を2~4つ連続して重ね、その間にプーリング層でサイズを半分にすることを繰り返す構造になっている。