坂本真綾が作詞した曲の歌詞を形態素解析し、頻出ワードを調べてみた。
発端
真綾、孤独って言葉好きすぎるだろう。けっこうな使用頻度では?
— れーふぉ (@re_fort) 2014年4月15日
【スポンサードリンク】
前提
坂本真綾(サカモトマーヤ含む)が作詞した曲を対象とする。
集計対象とする品詞は名詞のみとする*1。
同じ曲に複数回出てくる同一単語はひとつとしてカウントする。
結果(上位100単語)
単語 | 出現回数 |
---|---|
こと | 53 |
私 | 45 |
今 | 30 |
もの | 30 |
君 | 29 |
人 | 29 |
手 | 28 |
とき | 26 |
あなた | 25 |
誰 | 23 |
自分 | 22 |
中 | 22 |
ひとつ | 21 |
愛 | 21 |
僕 | 20 |
声 | 20 |
ことば | 20 |
そば | 19 |
夢 | 19 |
それ | 19 |
少し | 18 |
ひとり | 17 |
空 | 17 |
何 | 17 |
世界 | 17 |
星 | 17 |
ここ | 16 |
日 | 16 |
誰か | 16 |
ふたり | 15 |
すべて | 15 |
目 | 15 |
どこ | 15 |
場所 | 15 |
胸 | 15 |
未来 | 14 |
ため | 14 |
恋 | 14 |
時 | 14 |
街 | 14 |
前 | 12 |
気持ち | 12 |
きみ | 12 |
風 | 12 |
道 | 12 |
まま | 12 |
夜 | 11 |
雨 | 11 |
顔 | 11 |
いつ | 11 |
心 | 10 |
明日 | 10 |
気 | 10 |
みんな | 10 |
約束 | 10 |
光 | 10 |
朝 | 10 |
たくさん | 10 |
本当 | 9 |
そこ | 9 |
今日 | 9 |
時間 | 9 |
それだけ | 8 |
きれい | 8 |
先 | 8 |
景色 | 8 |
色 | 8 |
何度 | 8 |
遠く | 8 |
僕ら | 8 |
涙 | 8 |
このまま | 8 |
さよなら | 7 |
水 | 7 |
ところ | 7 |
ふたつ | 7 |
孤独 | 7 |
映画 | 7 |
どこか | 7 |
記憶 | 7 |
冬 | 7 |
影 | 7 |
名前 | 7 |
過去 | 6 |
自由 | 6 |
幸せ | 6 |
ひかり | 6 |
答え | 6 |
一度 | 6 |
最初 | 6 |
かたち | 6 |
終わり | 6 |
命 | 6 |
音 | 6 |
なに | 6 |
笑顔 | 6 |
背中 | 6 |
わけ | 6 |
大事 | 6 |
何か | 6 |
以降のデータに関しては、コチラを参照。
感想
総合的にみると、やはり透明感のある単語が多く選ばれている印象。
単語別に思ったこと。
- 「音楽」…もっと出てきてるかと思ったけど3回しか出てこなかった。
- 「声」…職業柄かなかなかの出現回数。
- 「孤独」…7回という結果だった。多いほうかな?
- 「影」…あんまり印象に残っていない単語だけど、「孤独」と同様に7回だった。
- 「愛」「恋」…「愛」が21回に対し、「恋」は14回だった。「愛」のほうが使われやすい。
- 「ことば」「言葉」…「ことば」が20回に対し、「言葉」は4回だった。ここまで顕著な差が出ているのはどうしてだろう?
「僕」と「ぼく」の出現回数を比べると、「僕」が20回、「ぼく」が4回*2という逆転現象が起こってるから、ひらがなが好きという理由ではなさそう。
形態素解析ツールを初めて使ってみたけど、なかなか楽しい。
これくらいの規模で調べるだけなら、MeCabやChaSenを導入することなく、Yahoo!のAPIでなんとかなるなー。
- 作者: 坂本真綾
- 出版社/メーカー: 講談社
- 発売日: 2011/08/12
- メディア: 文庫
- 購入: 1人 クリック: 16回
- この商品を含むブログ (14件) を見る
参考サイト
http://cgi.geocities.jp/ydevnet/sample/jlp/sample2/ma_sample.php