G検定カンペ用語集

自分用G検定用チートシート。


非線形回帰の手法のひとつ。
いくつかの要因(説明変数)からある事象が発生する確率を求める統計手法。
多変量解析の手法のひとつ。
名前に回帰とついているが、回帰問題ではなく分類問題に用いる手法分類問題を回帰問題に変換してから分類問題を解く)である。

二値分類」と「多クラス分類(目的変数が3つ以上)」の両方に適用できる。

<ロジスティック回帰の例>
腫瘍が陽性か陰性かを予測する(二値分類)
画像に映っているのが犬か猫かを予測する(二値分類)
身長と体重から服のサイズ(S、M、L)を予測する(多クラス分類)
アヤメのデータから「セトサ種」「バージニカ種」「バージカラー種」の3品種に分類する(他クラス分類)
マーケティングにおいて、ユーザーが、次に購買行動を取る確率を予測するなどのケースでも利用される。

二値分類の問題ではシグモイド関数を用いる。
シグモイド関数は出力値が0と1の間に収まるよう正規化されているため、出力値を「ある事象が起きる確率」と解釈できる。

多クラス分類の問題では、ソフトマックス関数を使用する。
ソフトマックス関数は、各クラスの出力値が0と1の間にあり、全クラスの出力の合計値が1になるように正規化される。


<ロジスティック回帰の流れ>
目的関数としては、尤度関数を用いる。
1)対数オッズと呼ばれる値を、重回帰分析により予測する。
2)対数オッズにシグモイド関数(ロジスティック関数)を施すことで、クラスiに属する確率Piの予測値を求める。
3)各クラスに属する確率を計算し、最大確率を実現するクラスが、データが属するクラスと予測する。
(シグモイド関数(ロジスティック関数)を施すことで、出力値が0~1の間の値に正規化され、確率として解釈が可能になる。)





1980年代後半に考案された、順伝播型ニューラルネットワークの一種。
単純パーセプトロンを多数結合させている。
入力層と出力層で構成される単純パーセプトロンに対して、多層パーセプトロンは入力層、1つの隠れ層(中間層)、出力層の3層で構成される。
多層にしたことで、線形分離不可能な問題も解くことができるようになり、単純パーセプトロンの欠点を解決した。(第二次ニューラルネットワークブーム)
mlp
多層パーセプトロンの各層間のパーセプトロンは、お互いに結合しているような構造になっている。
この様な構造のニューラルネットワークを「全結合型ニューラルネットワーク」と呼ぶ。

学習のために誤差逆伝播法(バックプロパゲーション)を利用する。
より複雑な問題を解決するために隠れ層を4層以上にすると、勾配消失問題過学習の問題が発生し、問題を解消することができず、第二次ブームは終焉した。



迷路やオセロなど、ルールとゴールが決まっている問題のこと。
「AIはトイプロブレムしか解けず、現実世界に起こるような複雑な問題は解けない」と見なされ、第一次AIブームは終焉した。

<トイプロブレムの例>
迷路
各種パズル

ポーカー
チェス
オセロ
囲碁
将棋
ビデオゲーム



↑このページのトップヘ