駆け出しエンジニアの作業ノート

駆け出しエンジニアが作業ノート風にまとめるページ(関係無い事もしばしば)

言語処理100本ノックを始めた

言語処理100本ノックを始めてみました。

 

nlp100.github.io

 

少し気になった問題がありました。

 

nlp100.github.io

 

04.元素記号

 

ここでは、文を単語に分解し、特定の順番にある単語は先頭の1文字を、それ以外は先頭の2文字を取り出すという問題で、「元素記号」とある通り抜き出すと、周期表の冒頭部分が出てくるはずです。しかし、実際にやるとこうなりました。

 

{'H': 0, 'He': 1, 'Li': 2, 'Be': 3, 'B': 4, 'C': 5, 'N': 6, 'O': 7, 'F': 8, 'Ne': 9, 'Na': 10, 'Mi': 11, 'Al': 12, 'Si': 13, 'P': 14, 'S': 15, 'Cl': 16, 'Ar': 17, 'K': 18, 'Ca': 19} 

 

ja.wikipedia.org

 

元素記号に"Mi"は存在しません。ここに本来入るべきは"Mg"のマグネシウムです。

 

出てきた答えに違和感を感じたので書いてみました。

 

github.com