教師あり学習の中でも連続値を予測するタスク。
・過去の売上から、将来の売上を予測する。
・平均気温と洗濯物が乾くまでの時間
・株価の予測

予測したいデータを目的変数と呼ぶ。
予測するために使用するデータを説明変数または特徴量と呼ぶ。

1つの目的変数を1つの説明変数で予測するものを単回帰分析
1つの目的変数を複数の説明変数で予測するものを重回帰分析と呼ぶ。

・身長から体重を予測する(単回帰分析)。
・身長と腹囲と胸囲から体重を予測する(重回帰分析)。


<単回帰分析>

Y=a・X+b

Xが説明変数、Yが目的変数、aとbが回帰係数(パラメーター)。
傾きaは説明変数の予測したい量への影響度を表す。


<重回帰分析>
kaiki01

kaiki02
は重回帰分析の偏回帰係数と呼ばれ、各説明変数の予測したい量への影響度を表す。
偏回帰係数の大小を比較することで、どの変数が予測に重要かを推測できる。

重回帰分析は、多重共線性(Multicollinearity)に注意する。
多重共線性とは、相関が高い説明変数同士を特徴量として組み合わせた際に、予測精度が下がってしまう現象である。
相関係数が1または-1に近い場合、相関が高い。

1回の実行で1つの数値を予測するのをシングル出力回帰
感情分析のように同時に複数の数値を出力するタイプはマルチ出力回帰と呼ぶ。