TwitterでB’zを分析してるブログが流れてきたので、なんとなく僕もB’zの歌詞ってどんな単語があるんだろうって気になってしまったので、アルバムごとにWord Cloudで歌詞を可視化してみます。
歌詞を可視化だぞ。随時更新中。
もくじ
準備
Word Cloudを使うためには単語で区切った日本語にしなくてはいけないようです。
例えば、「僕は寿司を食べたい。」→「僕 は 寿司 を 食べ たい。」
こんな感じにしてくれる素敵なライブラリがMeCab。pythonなどの形態素解析ライブラリです。
これを使って歌詞をうまいこと分割したらWord Cloudにinputするだけ!
※全アルバム完了後にpython実行環境の導入やMeCabの導入などもまとめる予定です。
デビュー〜90年代
1st Album B’z
TOP 10 の単語は以下の通り(単語,頻度)
[('All', 33), ('you', 20), ('my', 18), ('night', 17), ('of', 17), ('me', 16), ('day', 16), ('time', 15), ('Dance', 14), ('s', 14)]
ストップワードに入っている単語は除いています。なんと全て英単語。たしかに、英単語連発はしてるけど。全部とは予想できませんでした。面白いですね。
僕はIt’s not a dreamが好きです。All day,All night,sweat time…かなりランキングに入ってますね。
2nd Album OFF THE LOCK
TOP 10 の単語は以下の通り(単語,頻度)
[('君', 43), ('On', 24), ('Hold', 22), ('You', 16), ('僕', 16), ('今', 15), ('Night', 13), ('Loving', 12), ('中', 12), ('you', 11)]
wordcloudの仕様を理解してない、というか読んでないんですけど、1文字が現れないんですよね。君、僕、今、中。これ画像に出てきてません。すみません。
これら4つを除くとまたもや英単語での構成ですね。youとYouが入っていたり、データの前処理が重要ですね。とりあえずこのまま1周してから、まえ処理の修正等は考えます。
3rd Album BREAK THROUGH
TOP 10 の単語は以下の通り(単語,頻度)
[('to', 22), ('you', 22), ('amp', 19), ('the', 18), ('Hey', 16), ('we', 16), ('I', 14), ('Oh', 13), ('Love', 13), ('so', 13)]
1st Album と同じでまだまだ英単語が頻出である傾向に変わりはないようですね。そしてずーっと「you」があります。君に何を伝えたいのでしょうか。続きの可視化も楽しみですね。
4th Album RISKY
TOP 10 の単語は以下の通り(単語,頻度)
[('LOVE', 13), ('僕', 13), ('バンパイア', 11), ('君', 11), ('何', 11), ('ウーマン', 11), ('DOWN', 10), ('知ら', 9), ('すべて', 9), ('逢い', 8)]
一気に英単語が減りましたね。僕、君。なんかぽくなってきました。2nd Albumから「LOVE」に準ずるワードがずっといますね。そして、TO10にはいないけど画像中には「二人」というワードも2nd Albumからありますね。何か傾向が見えてきそうです。
このまま、最新アルバムまでやり続けたら稲葉さんの想いに近づけそうな予感。
5th Album IN THE LIFE
以降、鋭意作成中 ※最下部にて現時点での最新アルバム「DINOSAUR」だけ先に可視化しました。
6th Album RUN
2000年代
2010年代
20th Album DINOSAUR
TOP 10 の単語は以下の通り(単語,頻度)
[('あなた', 15), ('I', 14), ('champ', 14), ('弱い', 12), ('君', 12), ('人', 10), ('見', 10), ('誰', 9), ('声', 9), ('まだ', 8)]
最新の傾向はこんな感じらしいです。
画像では同じ単語が繰り返されてますけど、Word Cloudの仕様ですかね。
とりあえず、全アルバムについてやり終えたらまたここに戻ってきます。