機械学習の手法のひとつ。
特徴量と正解ラベルのセットを学習データとする。
特徴量と正解の間にある関係性を見出し、予測値を正解に近づけるように学習する。
たとえば、大量の動物の画像データに、「うさぎ」「パンダ」「くま」・・・等と事前にラベリングをしておく。
正解データを用意し、それらを教師(正解)として学習を行う。
学習していない未知の画像を入力した場合にも、学習した結果から「うさぎ」か「パンダ」か等を判定することができる。
・受信したメールが、正常なメールかスパムメールかを判定する。
・ローン申請者への融資リスクの肯定を判断する。
・選挙の特定の候補者についての投票率を予測する。
・住宅販売価格を、過去の実績に基づいて予測する。
学習データに正解を与えない教師なし学習と対をなす手法。
正解が明確である場合には教師あり学習、不明確な場合には教師なし学習を利用する。
汎用的に利用されている。
<教師あり学習のメリット>
人間が正解データを与えるため、学習精度が高く、学習速度も早い。
学習に用いる教師データが多いほど、学習精度が高まる傾向がある。
<教師あり学習のデメリット>
正解が存在しないケースには利用できない。
正解データの質が学習精度に影響を与える。
最初に正解データを与えなければいけないため、初めて販売する製品のターゲット市場を決める場合などでは利用できない。