音楽系SNS「last.fm」というサービスをご存じでしょうか。私は2年以上利用しています。
日本では、楽曲の聴取履歴の管理とレコメンデーション機能を利用する事が出来ます。また、開発用のAPIが無料で公開されおり、APIの使い方を練習するには非常に最適なコンテンツとなっています。
しかし、日本での利用者が少ないせいか、日本の楽曲については「日本国内ではメジャー」とされる楽曲でも、レコメンド結果が出力されないというものもあります。
自分でレコメンドエンジンを構築するには、膨大なデータが必要となります。やり方を調べると、この本に詳細なやり方が書かれていました。
Sparkによる実践データ解析 ―大規模データのための機械学習事例集
- 作者: Sandy Ryza,Uri Laserson,Sean Owen,Josh Wills,石川有,Sky株式会社玉川竜司
- 出版社/メーカー: オライリージャパン
- 発売日: 2016/01/23
- メディア: 大型本
- この商品を含むブログ (4件) を見る
ただ、肝心なデータセットについては既にリンク切れとなっていました。もう少し調べて、ここにたどり着きました。
いずれにせよ、自前のPCでは処理しきれない計算量なので、どこかにクラウドを借りないといけないと思います。もう少し検討してみます。