DATA-SCIENCE
「笑っていいとも」に安倍首相登場時の反応
出口慎二のT-newsコラム
Twitterでは、いつ、どんな話題が盛り上がったのか、ちょっと探ってみます。(こまかいことはこちら)
3/21(金)、フジテレビのお昼の番組、「笑っていいとも」に、安倍首相が出ました。この時間帯のつぶやきを追ってみましょう。
数字は「〜分台」。たとえば、「0」だったら、0分〜09分。「30」だったら、30分〜39分。ここでは、3/21日の12時台だけを見ています。
ですので、12:00.〜12:59。のデータ(つぶやき)を見ています。
また、ここでは、つぶやきのなかに、ハッシュタグ「#fujitv」が含まれていたつぶやきだけを拾っています。
つぶやき自体は膨大にあるのでしょうけれども、この時間帯に、ハッシュタグ「#fujitv」を含んだつぶやきは、3,700件ほどしかありませんでした。
とはいえ、3,700件だけとはいっても、これをいちいち見ていたのではやはり少なくはありません。また、「ようするにどんなだったの?」という概観は、これもこれで、意外と難しいものです。
キラリとひかるようなただひとつのコメントを拾うようなことは、なかなかできることではありませんが、大勢はどうだったか、大きな声にどんなものがあったのかは(多くの人が同じことを言っていたとしたら、それが何かは)、ある程度拾うことが可能です。
そうした試みのひとつとして、ここではTwitter上のつぶやきを「テキストマイニング」してみた結果を見てみます。
細かいことは無視しましょう。とりあえず、右下に「0」(12時00分〜09分)があり、右上に「30」(12時30分〜39分)があり、左上に「40」(12時40分〜49分)、左下に「50」(12時50分〜59分)がある、つまり、この図では、図の右下から、左回りに時間が進んでるんだな、ということだけ読み取ればOKです。
この流れに沿って図を見てみると、「到着」「ランプ」「お知らせ」→「登場」「安倍」「首相」→「タモリ」「バラエティ」「会食」「いちご」、といった語が見られます。
詳しいことはわかりませんが、時間に沿って、「到着」して、安倍首相が「登場」して、「イチゴ」の話でも出たのかな?くらいのことは予想できます。
「こんなものか」と言ってしまえばそれまでなのですが、それでも、こんな程度であれば、案外と簡単に(?)行うとこができます。
「テキストマイニング」とか「多変量解析」と言ってしまうと、急に、非日常に感じられまいますが、このコラムでは、つぶやきのテキストマイニングを中心に、新聞やテレビで、ちょっと話題に上がったネタなどを拾っていきたいと思います。
(著者について)
出口慎二(でぐちしんじ)
1972年生まれ。1997年、統計分析サービスを行う会社に入社。調査データの入力・集計から多変量解析による分析、関連するプログラミング業務などに携わる。退社後、2001年以降、個人でデータ分析事業を行なう。
2003〜2004年、IRJ(インターネットリサーチ研究会)にて会員社合同の実験調査プロジェクトの統括ディレクターを務める。
2004年、『自分でできるネットリサーチ』を3人共著で上梓。
2005年〜2007年、インフォプラント(現、マクロミル(2007年9月〜2010年7月はヤフー・バリュー・インサイト))に在籍してRQI(Research Quality Institute)を設立し主任研究員を務める。
2005年〜2007年度、サーベイ・メソドロジー研究会(日本行動計量学会の研究部会のひとつ)に参加、インターネットリサーチを含むデータ収集法の研究に携わる。
現在は現場におけるデータ分析業務に重きを置いています。
この記事をシェアする