シャニマスの歌詞をテキストマイニングしてみたら特徴が見えてきたので書こうと思います。
皆さんは、ふとこう思ったことはありませんか?
「なぜか分からないけどこの曲はシャニマスっぽい。でもどうしてそう思うのかは、分からない」と。
曲の印象を決定する因子は、曲のメロディや歌っている方の歌い方、声質、作詞家・作曲家など色々とありますが、今回はその中の歌詞に注目して「シャニマスっぽい曲」の特徴を探ってみようと思います。
この記事は「アイマス統計」様の以下の記事に触発され、テキストマイニングを行った結果を書き留めている記事です。是非当記事をご覧になる前に以下の記事もご覧ください。
idolmaster-statistics.hatenablog.com
方法
テキストマイニングという手法を用います。どういうものかと言うと…
テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。
色々難しいことが書いてありますが、要するに「文章の特徴を調べるための方法」がテキストマイニングと呼ばれるものだと言っています。
このテキストマイニングを行うにはPythonなどで自分でコードを書く方法や、Webアプリを用いる方法などがありますが、今回は「KH Coder」というPCのフリーソフトウェアを用いて分析を行いたいと思います。
対象
2020/11/9までにCDとして発売されているシャニマス楽曲全36曲。(エイプリールフール企画楽曲2曲を除く)
頻出語
まずは歌詞の中に出てきた上位30語を見てみましょう。
特徴的なのは、「空」という単語が一番多く用いられている点です。シャイニーカラーズのコンセプトが曲にしっかりと反映されている証拠と言えるでしょう。
また当然ですが、「Hi」や「Pa」といった繰り返し用いられている語が上位に来ています。
この同じ単語が繰り返し用いられる歌詞は、他のアイマスブランドと比べてもシャニマスは多く感じます。(後々別ブランドも別途記事にする予定です。)
また、英語を用いた歌詞がシャニマスは他のアイマスブランドと比較すると圧倒的に多いです。
共起ネットワークを見る
次に「共起ネットワーク」という頻出語を視覚化した画像を見てみようと思います。
ここでは「未知語(品詞が分析出来ない語)」を除外して画像化しています。
円が大きくなるほど単語が多く用いられいるという意味になっています。線で結ばれている単語は頻繁に共に出現しやすい単語です。同じ色の円は結びつきの強い単語をグループ分けしたものです。
かなりポジティブな単語が多く用いられているように感じますね。
「色」や「羽ばたく」、「翼」、「虹」といった語が頻出しているのはシャニマスならではという感じがします。
これらは「空」と共に用いられている事もよく分かります。
この結果より、シャニマスの楽曲には「空に関連する語」が意図的に多く用いられている事が分かりました。
このほかにも「光」や「未来」といったポジティブな語も多く用いられている事が分かりました。ただしこれらの語は、シンデレラガールズやミリオンライブでも多く用いられている語のため「シャニマスらしい語」に該当するかと言われると、そうでもない気がします。
まとめ
以上の結果をまとめると以下の様になります。
次回はシャニマスのユニットごとの結果を考察していこうと思います。
追記:
ユニットではなく全体曲について書いています。
ここまでお読みいただきありがとうございました。