突然ですが、皆さんは「データサイエンティスト」という職業をご存じでしょうか?
一般社団法人データサイエンティスト協会は、定款の中で以下のように定義しています。
第2条
データサイエンティスト(分析人材)とは、高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作ることができる者をいう。
2023年4月にGRIに入社した私の中でも、最初の認識はこのようなものでした。
ただ、半年働いている中で、この定義の中に隠れた重要な要素があると感じたので、今回はその要素について話していきたいと思います。
あくまでサイエンス
データサイエンティストというぐらいですから、そりゃそうだろと思う方もいるかもしれません。私の場合は、「データをビジネスに活かす」という印象を少し強めに抱いていたのかもしれません。では、どのように「データをビジネスに活かす」のでしょうか。
例えば、ある商品の売上を改善したいとなった場合、「個人の属性情報をクラスタリングしたら、購買商品の傾向が分かるのではないか」といった具合に仮説を立てて、検証していく必要があります。そうしないと、どのようなデータが必要か、何が売り上げにつながるかもわからずじまいで路頭に迷います(経験談)。また、クラスタリングの結果が毎回変わっては傾向も何もないので、誰がやっても何度やっても同じ結果になる再現性も求められます。
仮説や検証のサイクルや結果の再現性などの要素は、サイエンスには欠かせないものです。サイエンスを通してデータをビジネスに活かす、これがデータサイエンティストのデータサイエンティストたる所以だと感じています。
新しいものを生み出す
これは、入社当時の私もまったく感じていなかったわけではないです。データから得られる今までにない情報により顧客の要望を実現できる職業、データサイエンティストをこのように考えていた私にとって、「新しいものを生み出す」必要があることも覚悟していたつもりでした。
ただ、実際の業務で求められるものは想像をはるかに超えていました。
最もギャップが大きかったのは、「顧客の要望は顧客自身ですらわかっていない」ということです。顧客の要望を実現することを考えていた私にとって、あまりにも大きな壁でした。顧客の「これをしてほしい」に対応することが正解ではないのです。
先ほどの、ある商品の売り上げを改善したいという例になぞらえてみます。
顧客は「この商品の売上を改善したい」と言っていますが、実際は「この商品に限らず売上を改善したい」と思っています。
この場合、どうせならば「商品の売上に貢献する要素を知りたい」と思いませんか。そうすれば、改善という事後的な対応ではなく、事前の対応が可能になります。
相手が言葉にする要望をもとに相手の真の要望を引き出すこと、相手すら見えていなかった新しいものを生み出すこと、これらの力が強く求められると感じています。
相手に刺激を与える
一つ前のセクションでも述べましたが、データサイエンティストは顧客自身ですらわからない新しいものを生み出さなければなりません。ただ、こちらがいくら考えても相手が求めているものにたどり着けないことはよくあることでしょう(ですよね?)。
このような場合は、相手に聞くのが一番です。ただ、馬鹿正直に「何がほしい?」と聞いても相手はわかってないのですから、教えてもらえません。そこで、重要なのが「相手に刺激を与える」ことです。
またまた、ある商品の売り上げを改善したいという例になぞらえてみます。
「クラスタリングした結果から商品の購買層を知ることができた」、これを報告するだけでも顧客の要望が達成できそうですね。
「これはほかの商品を対象にしても同様に購買層を知ることができる(再現性⁉)」ということを添えれば、相手が真の要望にたどり着く可能性が上がるのではないでしょうか。ましてや、「パーソナライズな商品提供の事業が進んでいる」というこちらが知りえない情報を引き出すことができるかもしれません。
相手が考えを深められるようなインサイトを与えること、これにより相手の要望やこちらが知りえない情報を引き出すことができ、新しいものを生み出すことにつながりそうです。これができるとより魅力的なデータサイエンティストになるのだと思っています。
最後に
入社当時の私には見えていなかったデータサイエンティストの側面について書きました。
ただ、今の私にも見えていない側面が大いにあると思うので、気付いたらまた書きます!
この記事を読んで、「ちょっと違うな」「これが足りない」「例がショボいw」と感じた方、ぜひお話聞かせてください!