データサイエンス

ツィートから注目ニュースを見る

 

Twitterでは、いつ、どんな話題が盛り上がったのか、ちょっと探ってみます。(こまかいことはこちら

今回は【新聞】ネタです。Twitterでは、報道各局とも、その時その時のニュースを適宜ツイートしています。こうしたツイートがRTされていく様を追っていると、その日、その時々、どんなニュースが注目されたのかを見ることができます。

NP2

たとえば、これは、5/2(金)にツイッター上でつぶやかれた、報道各局の記事ツイートです。ツイート自体を、ひとつひとつ長々取り扱ってもいられないので、適宜、単語だけを抜き出してみています。ですので、この図だけ見ても、文章にはなっていませんが、ちょっと眺めてみると、なんとなく雰囲気はつかめませんか?
右下のほうに、時間の数字で言うと「7」〜「15」(7時台〜15時台)、だいたい朝からお昼ごろに話題に上がったニュースの言葉があるようです。「IE」「プログラム」などの語が見られます。
左下は、時間で言うと、「16」〜「19」(16時台〜19時台)、夕方ごろ。この時間帯は「ソウル」「事故」などの語を含むニュースがツイートされたようです。(そうした語を含むニュース記事が多くRTされたのでしょう。)
夜になると、図の上のほう、時間でいうと「20」〜「25」(20時台〜25時台)、言葉としては「タブレット」といった語があります。
図を手掛かりに、なんとなく読める部分もあるでしょう。これを手掛かりに、ツイート自体を見てみます。すると、朝は、「IE」(インターネットエクスプローラ)「プログラム」の不具合に関するニュース、夕は、「ソウル」の地下鉄追突「事故」に関するニュース、夜は、佐賀県の県立高校が導入した授業用「タブレット」の問題に関するニュースが、多くRTされていたんだな、ということが分かります。
新聞を読むのではなく、昨日話題になった新聞記事だけを拾い読みする、という感覚でしょうか。

ちなみに、この日、1日を通じて多くRTされた記事は、こんなものでした。(単純に、件数が多かった記事です。)

■08:20. RT @47news: 速報:米MSは欠陥が見つかった閲覧ソフト(IE)について、修復プログラムの無償配布を始めたと発表。 http://t.co/unWPgunaSt
■21:00. RT @47news: 速報:西武の岸孝之投手が、ロッテ6回戦で史上78人目(通算89度目)のノーヒットノーランを達成。
■22:10. RT @47news: 群馬、豚5千頭以上死ぬ 2万頭に感染・発症疑い http://t.co/gILIo0jqtm

また、1日を通じてみると、そんなに多いわけではないけど、ある時間帯だけ見ると、ちょっと多くRTされたよ、という記事には、このようなものがありました。(対応分析の結果から、相対寄与、絶対寄与を見ています。)

■17時台
→RT @47news: 速報:韓国のYTNテレビは2日、ソウルの地下鉄追突事故で170人余りが負傷したと報じた。

■22時台
→RT @akiba_ten_M: 授業用タブレットで不具合続出…開始に大幅遅れ : IT&メディア : 読売新聞(YOMIURI ONLINE) 渡す前にデータ全部入れておけよ… @Yomiuri_Onlineさんから
■27時台
→RT @Reuters_co_jp: ウクライナ南部オデッサで3人死亡、親ロ派と結束派衝突

話題になった話題だけを拾い読み、という見方もいいのではないでしょうか(笑。