内容ベースフィルタリングとの違いは、「何を基準としてレコメンド商品を選んでいるか」。
協調フィルタリングは、ユーザー同士の購買履歴を分析する。
内容ベースフィルタリングは、あくまでもタグを基準にしている。
購入履歴の少ない商品を提案したいなら内容ベースフィルタリングが、ユーザーの消費傾向を細かく踏まえたいなら協調フィルタリングが適している。
トランザクションデータ(顧客との取引で発生した情報)をもとにレコメンデーションを行う協調フィルタリングが「メモリーベース」。
「メモリーベース」は、ユーザをベクトル化する「ユーザベース協調フィルタリング」と、アイテムをベクトル化する「アイテムベース協調フィルタリング」に分かれる。
協調フィルタリングは、ユーザー同士の購買履歴を分析する。
内容ベースフィルタリングは、あくまでもタグを基準にしている。
購入履歴の少ない商品を提案したいなら内容ベースフィルタリングが、ユーザーの消費傾向を細かく踏まえたいなら協調フィルタリングが適している。
協調フィルタリングには、「メモリーベース」「モデルベース」「ハイブリッド」の3種類がある。
トランザクションデータ(顧客との取引で発生した情報)をもとにレコメンデーションを行う協調フィルタリングが「メモリーベース」。
「メモリーベース」は、ユーザをベクトル化する「ユーザベース協調フィルタリング」と、アイテムをベクトル化する「アイテムベース協調フィルタリング」に分かれる。
「メモリーベース」では、未評価の商品も、ユーザがどのように評価するか予測することができる。
ただし、レコメンデーションの正確性はトランザクションデータの量に左右される。
ユーザによる商品の評価データを抽象化して活用するのが「モデルベース」。
評価データが圧縮された状態で保管され、システムが統計的なアルゴリズムによって、消費活動のモデルを作り上げる。
システムが変わったとしても、モデルさえ取り出して流用すれば同じレコメンデーションを続けられる(再利用できる)というメリットがある。
デメリットは、メモリーベースより開発の工程が多いこと。
ただし、レコメンデーションの正確性はトランザクションデータの量に左右される。
ユーザによる商品の評価データを抽象化して活用するのが「モデルベース」。
評価データが圧縮された状態で保管され、システムが統計的なアルゴリズムによって、消費活動のモデルを作り上げる。
システムが変わったとしても、モデルさえ取り出して流用すれば同じレコメンデーションを続けられる(再利用できる)というメリットがある。
デメリットは、メモリーベースより開発の工程が多いこと。
協調フィルタリングとコンテンツベースフィルタリングの長所を組み合わせたものが「ハイブリッド」。
「ハイブリッド」が主流になりつつあるが、複数の手法を組み合わせなければならないため、開発に手間がかかる。