AIが機械学習に利用するデータ。
それぞれの例題に対応した正解が用意されているデータのこと。
例題に対して正解を出力させるための訓練を行う「教師あり学習」では、教師データが必要になる。

教師データはどのくらいの量が必要なのか? については、求める精度や利用するモデルなどによって異なるが、単純な画像の分類の場合、クラス(答え)ごとに1,000~10,000程度用意する必要がある。
従来の機械学習では、データの量をある程度増やすと精度が頭打ちになってしまうが、ディープラーニングではデータ量を増やしただけ性能が向上する。