文章データの主題=トピックを判断する自然言語処理の手法。
統計的潜在意味解析のひとつ。
言葉の意味を統計的に解析する。

文章を「複数の単語の集まり」と捉え、文章を、単語の共起性に沿って複数のクラスに分類する。
そのクラス内の単語が意味する内容を、トピックとする。
文章は複数の潜在的トピックから構成されており、それらは確率的に生成されると仮定する。
単語はトピックの確率分布に沿って出現すると考えるモデル。

トピックモデルは、記事などの探索・分類によく利用される。