自然言語処理のトピックモデル(クラスタリングを用いて文章中の話題を見つける手法)のひとつ。
現在のトピックモデルの主流。
ディリクレ分布という確率分布を仮定して確率値を生成。
過学習を防止する効果がある。
教師なし学習。
各単語が「隠れたあるトピック」から生成されているものとし、そのトピックを推定する。