駆け出しエンジニアの作業ノート

駆け出しエンジニアが作業ノート風にまとめるページ(関係無い事もしばしば)

Word2Vec

推しに関するコーパスを集める

久々に、GitHubを更新してみました。 日向坂46の小坂菜緒さんに関する事を書いたはてなブログを集めて、MecabとWord2Vecを使って、モデルを作りました。 www.hinatazaka46.com ja.wikipedia.org 48pedia.org Qiitaできっかけになる記事を読んで作ろうと思い…

Word2Vecでプレイリスト生成してみる実験の続き

前回、一定の成果があると見込めたので今回はデータ量を増やしてやってみました。 psyduck-take-it-easy.hatenablog.com psyduck-take-it-easy.hatenablog.compsyduck-take-it-easy.hatenablog.com import timeimport psycopg2import psycopg2.extrasimport …

プレイリスト生成の検証終了

コードのtry文を移動させたところ、きちんと動作して最後までたどり着いたので記載させて頂きます。 import psycopg2import psycopg2.extrasfrom gensim.models import word2vechost_name = port_number =dbname = rolename = passwd = def track_search(): …

Word2Vecを用いたプレイリスト生成の結果報告

Word2Vecを用いたプレイリスト学習の結果が出たのでご報告します。検証用に、以下のコードを書きました。 import psycopg2import psycopg2.extrasfrom gensim.models import word2vechost_name = port_number = dbname = rolename = passwd =def track_searc…

Word2Vecを使ったプレイリスト生成実験

少し日が空いてしまいましたが、学習は継続しています。プレイリスト生成についてですが、Word2Vecを用いたモデル構築を行うことにしました。 文章の分かち書きの手法を応用し、Last.fmの書式にならい「アーティスト名 - 曲名」を単語とし、Last.fmの類似度…

Word2Vecによるモデル構築実験

機械学習の第一歩として、Word2Vecによるモデル構築実験を行うことにしました。 既にWikipediaを使ったモデル構築例があるので、違う物を使うことにしました。対象はずばり、このブログの本文。 もちろん、膨大なデータ量が無いと正確性が出ないのは百も承知…