モデル全体に対する予測根拠を可視化するための手法。
主にCNNによる画像認識を対象としており、「画像のどこに注目してクラス分類しているのか」を可視化する。
ディープラーニングのモデルそのものに判断根拠を持たせる手法。
ネットワークにGAP処理がなくても可。
Grad=Gradient=勾配情報
勾配が大きいピクセルは予測クラスの出力に大きく影響する重要な場所であると判断し、そのピクセルに重みを付ける。
CNNが分類のために注視していると推定される範囲を、ヒートマップで表示することができる。
問題点は、解釈過程の中で画像の解像度が下がってしまうこと。
この問題点を解決するために、入力値の勾配情報をも使うGuided Grad-CAMという改善版もある。