画像認識とは、画像の中に写っているものが「何なのか?」を、コンピューターが識別する技術。
人間なら、画像を見ればどこに何が映っているかを自らの経験を元に推測することができるが、コンピュータには人間のような経験や記憶の蓄積がないため、仮に「うさぎ」が映った画像を与えても、それを「うさぎ」だと認識できない。
画像認識では、コンピュータにデータベースから大量の画像を与え、対象物の色や形などの特徴を自動的に「学習」させることで、同じ特徴を持った画像が与えられれば、それを「うさぎ」だと推測することができるようになる。
画像認識は、ディープラーニング(深層学習)の登場によって注目を集めるようになったが、技術的な歴史は古い。
画像認識のもっとも強力な手法は、「畳み込みニューラルネットワーク(CNN)」。
CNNの初期モデルは、日本人研究者の福島邦彦氏が1982年に発表した「ネオコグニトロン」である。