=Generic Object Recognition
実世界の画像に含まれる物体を、一般的な名称で認識すること。
画像に複数の物体が映っている場合、各クラスを識別する以前に、画像に写っている各物体の位置を見つけ出す必要がある。
たとえば、物体候補を「ウインドウ」で囲み、各ウインドウ内の物体をクラス予測用の分類器に渡し画像認識を行う。
物体ではない場合は、背景として認識する。
一般物体認識は、次の2つのタスクから成り立つ。
1)物体検出・同定(Object Detection/Localization)
画像の中で物体がどこにあるのか?
この領域は物体なのか、背景なのか?
2)物体認識・分類(Classification)
どのクラスに属する物体なのか?
一般物体認識の難点
・「一般的な名称」が表す同一クラスの範囲が広い。
・物体を背景や他のクラスの物体から切り出さなければいけない
・特徴を抽出する作業が複雑