駆け出しエンジニアの作業ノート

駆け出しエンジニアが作業ノート風にまとめるページ(関係無い事もしばしば)

last.fmを盛り上げたい

音楽系SNSlast.fm」というサービスをご存じでしょうか。私は2年以上利用しています。

www.last.fm

 

日本では、楽曲の聴取履歴の管理とレコメンデーション機能を利用する事が出来ます。また、開発用のAPIが無料で公開されおり、APIの使い方を練習するには非常に最適なコンテンツとなっています。

 

しかし、日本での利用者が少ないせいか、日本の楽曲については「日本国内ではメジャー」とされる楽曲でも、レコメンド結果が出力されないというものもあります。

 

自分でレコメンドエンジンを構築するには、膨大なデータが必要となります。やり方を調べると、この本に詳細なやり方が書かれていました。

 

Sparkによる実践データ解析 ―大規模データのための機械学習事例集

Sparkによる実践データ解析 ―大規模データのための機械学習事例集

 

 

ただ、肝心なデータセットについては既にリンク切れとなっていました。もう少し調べて、ここにたどり着きました。

 

github.com

 

いずれにせよ、自前のPCでは処理しきれない計算量なので、どこかにクラウドを借りないといけないと思います。もう少し検討してみます。