非線形回帰の手法のひとつ。
いくつかの要因(説明変数)からある事象が発生する確率を求める統計手法。
多変量解析の手法のひとつ。
名前に回帰とついているが、回帰問題ではなく分類問題に用いる手法分類問題を回帰問題に変換してから分類問題を解く)である。

二値分類」と「多クラス分類(目的変数が3つ以上)」の両方に適用できる。

<ロジスティック回帰の例>
腫瘍が陽性か陰性かを予測する(二値分類)
画像に映っているのが犬か猫かを予測する(二値分類)
身長と体重から服のサイズ(S、M、L)を予測する(多クラス分類)
アヤメのデータから「セトサ種」「バージニカ種」「バージカラー種」の3品種に分類する(他クラス分類)
マーケティングにおいて、ユーザーが、次に購買行動を取る確率を予測するなどのケースでも利用される。

二値分類の問題ではシグモイド関数を用いる。
シグモイド関数は出力値が0と1の間に収まるよう正規化されているため、出力値を「ある事象が起きる確率」と解釈できる。

多クラス分類の問題では、ソフトマックス関数を使用する。
ソフトマックス関数は、各クラスの出力値が0と1の間にあり、全クラスの出力の合計値が1になるように正規化される。


<ロジスティック回帰の流れ>
目的関数としては、尤度関数を用いる。
1)対数オッズと呼ばれる値を、重回帰分析により予測する。
2)対数オッズにシグモイド関数(ロジスティック関数)を施すことで、クラスiに属する確率Piの予測値を求める。
3)各クラスに属する確率を計算し、最大確率を実現するクラスが、データが属するクラスと予測する。
(シグモイド関数(ロジスティック関数)を施すことで、出力値が0~1の間の値に正規化され、確率として解釈が可能になる。)