以下の本を購入して、協調フィルタリングの勉強をしています。
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
ユーザーベースでの推薦だとユーザー数が増えるほど計算が膨大となる一方で、アイテムベースの協調フィルタリングでは、アイテム間の類似度計算のメンテナンスが大変なぶんレコメンドが容易になると書かれていました。
Last.fmに話を置き換えると、既に楽曲の類似度についてはAPIで提供されており、それを使えば良いという方向に話が落ち着きます。ただ、Last.fmというサービス自体が元々イギリス発祥で有る事から、日本でメジャー楽曲でも楽曲間類似度が計算されていない楽曲が多数存在します。そのため、現段階での自分の中での課題は、楽曲間類似度が計算されていない楽曲同士をどのように結び付けるかです。なお、自分が楽曲間類似度をもとにプレイリストを生成するプログラムは以下で公開させて頂いております。
ベイズ統計の本を読みながら検討してみます。