G検定カンペ用語集

自分用G検定用チートシート。


2014年に発表された、一般物体認識のアルゴリズムの原型。
入力は画像データ、出力は画像内の各物体の領域を示すボックスとクラスラベルである。

①物体候補領域を、バウンディングボックスで切り出した後、画素粒度でグルーピングすることで物体らしき領域を見出す。
②すべてのボックスを統一的にリサイズする(CNNは固定サイズの入力のみ受けとるため)。
領域ごとに個別にCNNを呼び出し、画像から特徴量を算出する。
③CNNで求めた特徴量をSVMモデルによって学習し、クラス鑑別ができるモデルを構築する。
未知の画像が入力された場合は、学習時と同様にCNNで求めた特徴量をもとに学習済みのSVNモデルで分類する。





ROI=Region of Interst

物体検出において、物体が存在しうる候補領域のこと。
境界で区切られた、関心のひとつの物体の全ての領域。

関心領域を矩形(長方形)で切り出す(バウンディングボックス)領域であったり、背景や建物の、輪郭を囲って閉じた領域を指すことが多い。


物体検出に用いられる矩形(長方形)の部分領域。
物体検出では、バウンディングボックスを用いて、画像内の物体の位置推定とクラスの分類が行われる。

↑このページのトップヘ