組み合わせ方には、いくつかの手法がある。
教師なし学習で特徴表現を獲得した後で、教師あり学習を行って、そのモデルを再学習する手法や、
正解ラベルがついているデータとついていないデータの両方を使って、
1)まず正解ラベルがついているデータを使って教師あり学習を行い、
2)1)で構築した分類モデルを使って、正解ラベルがついていないデータのうち、まずは信頼度の高いデータのラベルを予想する。
3)新しくラベルづけされたデータセットを使って、再度モデルを訓練する。
4)残りの正解なしデータのラベルを予測する。
という手法がある。
正解ラベルがついている十分な量のデータを用意できないときや、正解ラベルをつける作業(アノテーション)のコストを削減したい場合に、半教師学習を使うと有利になる。
半教師あり学習は、通常の教師あり学習よりも精度を高められることもあるといわれている。
デメリットとしては、ラベル付きデータに偏りがあると上手くモデルが学習できなくなる点がある。