データサイエンス

『データ分析人材になる。 目指すは「ビジネストランスレーター」』を読んで

遅ればせながら、

『データ分析人材になる。 目指すは「ビジネストランスレーター」』
木田 浩理 (著), 伊藤 豪 (著), 高階 勇人 (著), 山田 紘史 (著)

データ分析人材になる。 目指すは「ビジネストランスレーター」 | 木田 浩理, 伊藤 豪, 高階 勇人, 山田 紘史 |本 | 通販 | Amazon

を拝読しました。
分析に関わる人は控えめに言って、暗記するまで読んだ方がいいかもって思いました。数式は出てこないですが、数式よりも大切なことが書いてあります。

本書は、5Dのフレームワークに沿って書かれています。
5Dのフレームワークは以下の5Dです。

  • Demand(要求):要求を聞く
  • Design(デザイン):全体の絵を描く
  • Data(データ):データを集める
  • Develop(開発):分析する
  • Deploy(提供):展開する

この5Dごとに、事例や実践や人材育成について書かれています。そして、最初の方に失敗事例が書かれており、この一部を抜粋させていただきます。

1-2-1 Demandの失敗

ある企業の役員クラスの方から分析依頼を受けたときのことです。本業の業績は緩やかな下降傾向で、さらに今後、デジタル化や少子高齢化などのトレンドによって本業が時代遅れになり、業績の下降傾向が強まるのではないか、という不安をいだいていらっしゃいました。「このまま何もしなければ危ない」「自社のデータをAIで分析して新しい取り組みをしていく必要がある」との思いで、データ分析プロジェクトがスタートしました。


ただ、具体的に「どの分野がどのくらい悪いのか」「今後どうしていきたいのか」と聞いても、明確な答えは返ってきません。

1-2-2 Designの失敗

「広告効果を分析する」これまでにないデータ分析プロジェクトが立ち上がりました。


外部の分析専門会社はゼロから効果予測モデルをつくり、期間も1年弱に及んだので、想定以上の多額なコストが必要になりました。しかも、成果物は経営層を満足させることができず、社員は見ることすらないままでした。最終的には、広告戦略自体の見直しが必要になったこともあり、プロジェクトは中止。後にはほとんど何も残りませんでした。

1-2-3 Dataの失敗

実際に顧客データを見てみると、確かに1000万件程度ありましたが、属性を格納した列が空欄になっているデータがたくさんあるのです。「顧客番号」や「住所」、「電話番号」についてはおおよそ入力されているのですが、メールアドレスはかなり不明の場合が多く、性別や生年月日といった基本的な情報も不明のケースが多いのです。

これは、失敗事例のうちの5Dのうちの最初の3Dぶんなのですが、この時点の感想は、3/3で
「明日は我が身」
「明日は我が身」
「明日は我が身」
でした。この後に成功事例が5Dぶん書かれているので、事例は全部で5D×2で10あります。結局、感想は10/10で
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
「明日は我が身」
でした。ちなみにここまでで、本の全体の1/3です。

テクノロジーに明るい企業において、経営者や分析を依頼する側がデータ分析に対する正しい期待値を持っていて、データサイエンティストもビジネスの領域で会話していれば問題は起こりづらいかもしれません。実際にはそのケースは稀であり、この現実側から見たデータ分析が書かれている貴重な本だと思います。

データサイエンティストは全員、許される範囲で失敗プロジェクトを経験してみると、身にしみて成長するかもしれませんが、なかなかそうもいかないのでこの本はおすすめです。