記事一覧      日常       音楽       考え       ドラマ       映画       CM       Web

【音楽】坂本真綾が作詞した曲を形態素解析してみた

坂本真綾が作詞した曲の歌詞を形態素解析し、頻出ワードを調べてみた。

f:id:re_fort:20140416205025j:plain


発端



【スポンサードリンク】


前提

  • 坂本真綾(サカモトマーヤ含む)が作詞した曲を対象とする。

  • 集計対象とする品詞は名詞のみとする*1

  • 同じ曲に複数回出てくる同一単語はひとつとしてカウントする。

結果(上位100単語)

単語 出現回数
こと 53
45
30
もの 30
29
29
28
とき 26
あなた 25
23
自分 22
22
ひとつ 21
21
20
20
ことば 20
そば 19
19
それ 19
少し 18
ひとり 17
17
17
世界 17
17
ここ 16
16
誰か 16
ふたり 15
すべて 15
15
どこ 15
場所 15
15
未来 14
ため 14
14
14
14
12
気持ち 12
きみ 12
12
12
まま 12
11
11
11
いつ 11
10
明日 10
10
みんな 10
約束 10
10
10
たくさん 10
本当 9
そこ 9
今日 9
時間 9
それだけ 8
きれい 8
8
景色 8
8
何度 8
遠く 8
僕ら 8
8
このまま 8
さよなら 7
7
ところ 7
ふたつ 7
孤独 7
映画 7
どこか 7
記憶 7
7
7
名前 7
過去 6
自由 6
幸せ 6
ひかり 6
答え 6
一度 6
最初 6
かたち 6
終わり 6
6
6
なに 6
笑顔 6
背中 6
わけ 6
大事 6
何か 6

以降のデータに関しては、コチラを参照。

感想

総合的にみると、やはり透明感のある単語が多く選ばれている印象。

単語別に思ったこと。

  • 「音楽」…もっと出てきてるかと思ったけど3回しか出てこなかった。
  • 「声」…職業柄かなかなかの出現回数。
  • 「孤独」…7回という結果だった。多いほうかな?
  • 「影」…あんまり印象に残っていない単語だけど、「孤独」と同様に7回だった。
  • 「愛」「恋」…「愛」が21回に対し、「恋」は14回だった。「愛」のほうが使われやすい。
  • 「ことば」「言葉」…「ことば」が20回に対し、「言葉」は4回だった。ここまで顕著な差が出ているのはどうしてだろう?
    「僕」と「ぼく」の出現回数を比べると、「僕」が20回、「ぼく」が4回*2という逆転現象が起こってるから、ひらがなが好きという理由ではなさそう。

形態素解析ツールを初めて使ってみたけど、なかなか楽しい。
これくらいの規模で調べるだけなら、MeCabやChaSenを導入することなく、Yahoo!のAPIでなんとかなるなー。

アイディ。 (星海社文庫)

アイディ。 (星海社文庫)


参考サイト

歌詞タイム

テキスト解析デモ - 日本語形態素解析

*1:ごちゃごちゃしてしまうため

*2:「ボク」は1回