DS検定

情報収集:一次情報と二次情報の違い

データサイエンスでよく聞く「一次情報」(一次データ)「二次情報」(二次データ)、どういうものでしょうか。

データ分析プロジェクトでは、分析の対象とするデータが必要なのはご存知の通りです。それ以外に、分析を始める前に現状を把握し、課題を定義するために必要な情報(データ)を仕入れる必要があることもあります。

自ら生み出した情報かどうか、情報源によって、情報には大きく「一次情報」と「二次情報」に分けることができます。

一次情報

一次情報とは「自分が直接体験をする、調査やヒアリングを行うことで得られた情報」を指しています。自ら行動することによって取得したオリジナルの情報です。

企業の立場でいうと、「一次データ」と呼ばれるものは、自社(の特定の部門)に蓄積したデータのことをいいます。例えば、自社サイトへのアクセス履歴や、自社商品の購入履歴などが挙げられます。

一次情報の具体例

(例1)分析案件を依頼したクライアント企業の中で、現場を最も把握している従業員にヒアリングして得られた情報。この従業員が過去の分析担当者、業務全体を把握しているマネージャーであることが多いです。複数の視点から情報を集め、過去の経験や先入観、偏った意見や情報だけで判断しないことに要注意です。

(例2)分析の対象があるロケーションを伴う場合、現場(例:物流倉庫、工場、小売店)の視察に自ら出向いて、観察事項を記録したり関係者にインタビューしたりして得られた情報。

(例3)ある食品の売れ行きを分析するために、その食品を自ら購入し、写真を撮影し、実際に食べて見て味や香りや食感の感想を記録した情報。

二次情報とは

二次情報は「自分の直接な体験からではなく、一次情報を所有するソースから取得した情報」を指しています。

例えば、他人から聞いた情報、他人が記録した一次情報を譲り渡されたもの、ウェブサイトや文献から得られた情報が挙げられます。

企業にとっての「二次データ」とは、外部から取得したデータ、例えば、他社または官公庁や研究機関が保有する一次データを取ってきたものです。

二次情報の具体例

(例1)ある食品の売れ行きを分析するために、口コミサイトから、ウェブ・スクレイピングを用いて口コミの文章をかき集めてきました。このように収集したのは二次情報です。口コミサイトには、その食品を食べてみた人たちからの一次情報が集まっています。

一次情報と二次情報のそれぞれの役割

一次情報は自らが情報源とやりとりすることで取得した情報なので、二次情報に比べて信頼性が高いです。しかも自分しか持っていない情報であることに価値があります。一方で、収集のコストが高く、時間だけではなく調査にお金がかかることもあります。一気に多くの情報を集めることができません

これに対して二次情報は、自分以外の人も同じ情報を持っているため、一次情報に比べては「保有価値」が低くなります。また、現実とは異なる、人為的な操作や解釈が情報に加わえられている可能性も疑うべきです。一方で、一度に多くの情報を取得することができます

データ分析プロジェクトにおいては、一次情報は現状把握のための情報になるのに対し、二次情報はボリュームを取れるため、データ分析プロジェクトの実際の題材にできます

その向こうに、データ分析に使われるのは「3次データ」もあります。「3次データ」は、一般的に、他のデータを加工・整形し、第3者(サードパーティー)がビジネスに使いやすくしたデータを指しています。

例えば、ポイントカードの会社、マーケティングの会社は一次や二次データを収集し、それを使いやすい形に集計・整形した成果物を販売します。

1次データ、2次データ、3次データのそれぞれの役割を理解し、これらを組み合わせて分析することで、事業にとって有益な情報が得られやすくなります。

 

 

担当者:ヤン ジャクリン(分析官・講師)

 

yan
データ分析官・データサイエンス講座の講師