データサイエンス

ワールドカップ代表メンバー発表時の反応

 

Twitterでは、いつ、どんな話題が盛り上がったのか、ちょっと探ってみます。(こまかいことはこちら

FIFAワールドカップ2014 ブラジル大会まであと1か月(6月12日開幕)。5月12日お昼過ぎ、日本の代表メンバー発表が行われました。ここでは、代表23名いずれかの名字(漢字)の文字列を含むツイートを拾ってみました。発表から少し置いた、18時台と21時台で拾ってみました。

<18時台><18時台>
<21時台><21時台>

21時台では、だいぶん、代表選手に関するつぶやきは落ち着いてきているようでした(合計すると、18時台35,772件/21時台13,646件。いずれとも「酒井」の重複は除く)。

さて、いずれとも共通しているのは、「大久保」を含むツイートの多さと、「齋藤」を含むツイートの少なさです。「大久保」の多さは、これが、いわゆる「サプライズ」の選出だったからでしょう。「齋藤」の少なさは、字体のせいでしょうか(「斉藤」や「齊藤」は拾っていません。「齋藤」を含むツイートのみ拾っています)。なお、「酒井」は、名字だけで拾ったため、2人(「宏樹」「高徳」)を区別していません(2行ありますが、同一です)。

18時台の時点では、「大久保」の多さは群を抜いているものの(「齋藤」の少なさも、ですが、これは字体のせいでしょう)、ほか、似たり寄ったり、みな、ある程度の件数があります。この時点では、選出メンバーが誰であるか、23人全員あるいは22人を書いたつぶやきも(「齋藤」だけ含まず「22」人というつぶやきも多い(たとえば「斎藤」と書かれていたりします))692件、全体の7%ほどありました。1つぶやきあたりの記載人数は、平均して、3.5人でした。

21時台では、1つぶやきあたりの記載人数は、平均して、2.0人。22人以上を書いたつぶやきは、149件、2%、でした。
なお、文字列だけで拾ってきているので、たとえば、「山口」が、「山口蛍」なのか、「山口県」なのかは、区別していません。
18時台と21時台、いずれとも共通しているのは、以下のような傾向のようです。

・GKではわずかに西川についての言及が多かった。
・DFでは内田についての言及が多かった。
・MFでは長谷部についての言及が少なかった。
・FWは、大久保がダントツ、ついで、本田、香川への言及が多かった。

私自身はサッカーに疎いのですが、こんな感じでしょうか…?