G検定カンペ用語集

自分用G検定用チートシート。


画像の中から物体の位置とカテゴリ(クラス)を検出すること。
はじめに、特定のクラスの物体を含む固定サイズのバウンディングボックスを推定する。
関心領域(物体が存在しうる候補領域)を矩形で切り出して、物体を特定する。
入力画像においてすべての候補領域を洗いだした後に、候補領域を画像分類器に入力する。

物体検出を使用した一般画像認識の手法には、R-CNN、Fast R-CNN、Faster R-CNN、SSD、YOLOなどがある。


=Generic Object Recognition
実世界の画像に含まれる物体を、一般的な名称で認識すること。

画像に複数の物体が映っている場合、各クラスを識別する以前に、画像に写っている各物体の位置を見つけ出す必要がある。
たとえば、物体候補を「ウインドウ」で囲み、各ウインドウ内の物体をクラス予測用の分類器に渡し画像認識を行う。
物体ではない場合は、背景として認識する。

一般物体認識は、次の2つのタスクから成り立つ。
1)物体検出・同定(Object Detection/Localization)
画像の中で物体がどこにあるのか?
この領域は物体なのか、背景なのか?
2)物体認識・分類(Classification)
どのクラスに属する物体なのか?

一般物体認識の難点
・「一般的な名称」が表す同一クラスの範囲が広い。
・物体を背景や他のクラスの物体から切り出さなければいけない
・特徴を抽出する作業が複雑











=Variable Auto-Encoder
オートエンコーダを活用した生成モデル
①入力画像の特徴量を統計分布に変換する
②統計分布から、データ点をランダムサンプリングする
③サンプリングした点をデコーダによって復元することで、新しい画像データを生成する

変分オートエンコーダでは、生成に必要な潜在空間の変数は確率分布の統計量(平均・分散)に相当する。
これらの統計量を正しく表現できるよう、モデルが学習する。









↑このページのトップヘ