駆け出しエンジニアの作業ノート

駆け出しエンジニアが作業ノート風にまとめるページ(関係無い事もしばしば)

アイテムベースの協調フィルタリング

以下の本を購入して、協調フィルタリングの勉強をしています。

 

 

集合知プログラミング

集合知プログラミング

 

 

ユーザーベースでの推薦だとユーザー数が増えるほど計算が膨大となる一方で、アイテムベースの協調フィルタリングでは、アイテム間の類似度計算のメンテナンスが大変なぶんレコメンドが容易になると書かれていました。

 

Last.fmに話を置き換えると、既に楽曲の類似度についてはAPIで提供されており、それを使えば良いという方向に話が落ち着きます。ただ、Last.fmというサービス自体が元々イギリス発祥で有る事から、日本でメジャー楽曲でも楽曲間類似度が計算されていない楽曲が多数存在します。そのため、現段階での自分の中での課題は、楽曲間類似度が計算されていない楽曲同士をどのように結び付けるかです。なお、自分が楽曲間類似度をもとにプレイリストを生成するプログラムは以下で公開させて頂いております。

 

github.com

 

ベイズ統計の本を読みながら検討してみます。