画像の中から物体の位置とカテゴリ(クラス)を検出すること。
はじめに、特定のクラスの物体を含む固定サイズのバウンディングボックスを推定する。
関心領域(物体が存在しうる候補領域)を矩形で切り出して、物体を特定する。
入力画像においてすべての候補領域を洗いだした後に、候補領域を画像分類器に入力する。

物体検出を使用した一般画像認識の手法には、R-CNN、Fast R-CNN、Faster R-CNN、SSD、YOLOなどがある。