機械学習の手法のひとつ。
教師あり学習に正解ラベルがつけられているのに対し、学習データに正解を与えない状態で学習させる学習手法。

正解がなく特徴量のみがある。
正解がないため、教師あり学習で行える分類や回帰の問題には対応できない。

教師なし学習の狙いは、学習データそのものが持つ構造を見つけ出すこと
正解・不正解が明確でない場合に効果を発揮する。
代表的なものは、クラスタリングと次元削減。

<クラスタリング>
クラスタリングはデータをいくつかのクラスタにグルーピングすること。
正解のないデータから、共通する特徴を持つグループにわける。
代表的な手法に、K-means法がある。

<次元削減>
データを特徴づける情報を抽出すること。
情報を凝縮させる(データの次元数を減らす)ことで、高次元のデータを低次元のデータに変換し、本質的な情報を導き出す。

例えば、国語、数学、理科、英語という5教科(5次元)のそれぞれの得点からは、学生の学力を評価しにくいが、5教科を「理系」「文系」の2つの軸(主成分)に統合することで、「理系が得意な学生」「文系が得意な学生」と見ることができ、評価しやすくなる。

代表的な手法に、主成分分析(PCA)がある。