G検定

データ分析の初心者に伝えること

手元に一定量のデータさえあれば、ひたすら複雑な処理と計算をして何らかの数字、たとえ全く意味のない数字でも、叩き出すことができます。この記事では、無駄を防ぎ、有意義な分析結果を生み出すために留意すべきことを「メモ形式」で分析初心者に伝えます。

統計を集めるときに考えること

「統計を集める」や「統計をとる」という表現をよく聞きますが、これは簡単にいうと、「知りたいことのためにデータを集める」ことです。

統計をとる前に「何を知りたいのか」という具体的な疑問を持つことが重要です。次に、その疑問について自分の中で予想を持つことです。これは「仮説」と呼びます。仮説を設定することは統計学的手法の特徴の1つです。この仮説が正しいかどうかを示すために調査を行い、それに必要なデータを集めます。

もちろん、収集するだけでは意味がなく、集めた統計を正しく活かしてはじめてビジネス戦略や意思決定などに役立てることができます。最初に感じた疑問点に対する自分の考えや予想(仮説)が正しいかどうかを調べるために、統計分析(仮説検定など)、あるいは機械学習やBIなど他の手段で分析や可視化を行います。

データ分析は闇雲に行ってはいけない

分析の結果が有意義なものになるためには、分析担当者が以下の3要素をわきまえる必要があります。

(1)分析しようとする問題そのものについての理解
(2)データと分析手法についての理解
(3)分析結果に対する判断力

■まず何について分析したいのかを理解しよう

業務の一部にデータ分析を導入する際に、陥りやすい失敗として、「なぜデータ分析を行うのか?」といった目的が明確にされていないことです。

データ分析を行う「目的」と「目標」が曖昧なまま分析を無闇に進めると、途中から分析の方向性がズレたり、無駄な作業時間を費やしたりしてしまいがちです。そうするとデータ活用で業務の効率化どころか、かえって業務が煩雑になりかねません。

もう1つよくある失敗の原因は分析の手法にハマりすぎることです。データ分析の手法に固執すると、視野が狭くなり、ビジネスを発展させるためのヒントを見落としがちになります。データ分析は意思決定を援助するための手段に過ぎないことを思い出してください。

データ分析の中で意識すべきこと一覧

  • データの意味やデータが生成・収集された背景を理解する
  • どのようにデータの前処理を行い、どのような分析をすればよいかを試行錯誤する。正しく分析手法を理解できていないと、手法に相応しくないようなデータ処理をしやすくなります。
  • データの様々な落とし穴に注意し(例えば、外れ値、異常値、バイアス)、それらの処理を怠ってはいけない
  • 常にデータを疑い、常に分析結果を疑うこと
  • 主観的な仮説や分析手法は結果に偏りが生じさせ、可視化できていない課題や問題を見落とすことになります。

プロのデータ分析官も上の全てを常にできていないでしょう。あくまでもデータ分析者の姿勢です。

概ね仮説通りの結果が出る場合と、予想外の結果が出る場合があります。

前者の場合、それに基づいて有益な施策などを立てることに進めます。無事に正しく分析を行った結果を出せたとします。この結果を踏まえて、アクションを起こす準備ができていないと、もったいないですよね。

後者(想定外の結果)が出たときこそ、柔軟に頭を働かせて様々な可能性を考えるといいでしょう。分析のプロセス内のどこに見落としや間違いがあったのか、詳細を把握し評価することが求められます。データの取得方法や処理方法が間違っていたのかもしれないし、分析手法が間違っていたのかもしれない。データも方法も間違っていないとすれば、そもそもの仮説が間違っていたということになり、そこでは方向転換を余儀なくされることもあるでしょう。

執筆担当者:ヤン ジャクリン (講師・分析官)

 

yan
データ分析官・データサイエンス講座の講師