DATA-SCIENCE
ワールドカップ代表メンバー発表時の反応
出口慎二のT-newsコラムTwitterでは、いつ、どんな話題が盛り上がったのか、ちょっと探ってみます。(こまかいことはこちら)
FIFAワールドカップ2014 ブラジル大会まであと1か月(6月12日開幕)。5月12日お昼過ぎ、日本の代表メンバー発表が行われました。ここでは、代表23名いずれかの名字(漢字)の文字列を含むツイートを拾ってみました。発表から少し置いた、18時台と21時台で拾ってみました。

<18時台>

<21時台>
21時台では、だいぶん、代表選手に関するつぶやきは落ち着いてきているようでした(合計すると、18時台35,772件/21時台13,646件。いずれとも「酒井」の重複は除く)。
さて、いずれとも共通しているのは、「大久保」を含むツイートの多さと、「齋藤」を含むツイートの少なさです。「大久保」の多さは、これが、いわゆる「サプライズ」の選出だったからでしょう。「齋藤」の少なさは、字体のせいでしょうか(「斉藤」や「齊藤」は拾っていません。「齋藤」を含むツイートのみ拾っています)。なお、「酒井」は、名字だけで拾ったため、2人(「宏樹」「高徳」)を区別していません(2行ありますが、同一です)。
18時台の時点では、「大久保」の多さは群を抜いているものの(「齋藤」の少なさも、ですが、これは字体のせいでしょう)、ほか、似たり寄ったり、みな、ある程度の件数があります。この時点では、選出メンバーが誰であるか、23人全員あるいは22人を書いたつぶやきも(「齋藤」だけ含まず「22」人というつぶやきも多い(たとえば「斎藤」と書かれていたりします))692件、全体の7%ほどありました。1つぶやきあたりの記載人数は、平均して、3.5人でした。
21時台では、1つぶやきあたりの記載人数は、平均して、2.0人。22人以上を書いたつぶやきは、149件、2%、でした。
なお、文字列だけで拾ってきているので、たとえば、「山口」が、「山口蛍」なのか、「山口県」なのかは、区別していません。
18時台と21時台、いずれとも共通しているのは、以下のような傾向のようです。
・GKではわずかに西川についての言及が多かった。
・DFでは内田についての言及が多かった。
・MFでは長谷部についての言及が少なかった。
・FWは、大久保がダントツ、ついで、本田、香川への言及が多かった。
私自身はサッカーに疎いのですが、こんな感じでしょうか…?
(著者について)
出口慎二(でぐちしんじ)
1972年生まれ。1997年、統計分析サービスを行う会社に入社。調査データの入力・集計から多変量解析による分析、関連するプログラミング業務などに携わる。退社後、2001年以降、個人でデータ分析事業を行なう。
2003〜2004年、IRJ(インターネットリサーチ研究会)にて会員社合同の実験調査プロジェクトの統括ディレクターを務める。
2004年、『自分でできるネットリサーチ』を3人共著で上梓。
2005年〜2007年、インフォプラント(現、マクロミル(2007年9月〜2010年7月はヤフー・バリュー・インサイト))に在籍してRQI(ResearchQualityInstitute)を設立し主任研究員を務める。
2005年〜2007年度、サーベイ・メソドロジー研究会(日本行動計量学会の研究部会のひとつ)に参加、インターネットリサーチを含むデータ収集法の研究に携わる。
現在は現場におけるデータ分析業務に重きを置いています。
この記事をシェアする