データサイエンス

階級別データサイエンティストに求められるスキル

データサイエンティストのスキルレベルの定義

データサイエンティスト協会(DS協会)に設置されているスキル定義委員会では、
データサイエンティストに求められるスキルセットとそのスキルレベルを具体的に定義する活動に取り組んでおられます。
スキルレベルの定義の初版は2014年に発表され、2017年に第二版が公開されました。
データサイエンスはだいぶ世間に浸透してきたとはいえ、まだ細かなニュアンスまでは伝わっていないと感じることが多いので、
引き続き応援していきたいと思っています。

DS協会のスキルレベル定義書では、データサイエンティストを以下のように階級別に分けて、それぞれの階級で求められるスキル感を明示しています。

1. 見習いレベル
2. 独り立ちレベル
3. 棟梁レベル
4. 業界代表レベル

この記事では、日頃の業務を通して感じる各階級のスキルレベルを抽象的に書きます

スキル定義委員会の目的は「具体的にデータサイエンティストを定義する」ことにあります。
その分、当委員会が発表する内容は情報の粒度が細かく、また、専門用語もそれなりに登場するのもあって、
データサイエンスのビギナーが体系的に理解するのはハードルが高いように感じます。

そこで、この記事では日頃の案件やコミュニティ活動を通して気付いたことを抽象化し、
各階級のスキルレベルを説明してみたいと思います。
抽象化することで詳細は握りつぶしますが、全体の見通しは良くなると思います。

見習いレベルと独り立ちレベルの違い

データサイエンス業務の遂行には、ビジネス・数学・計算機の3つの分野の幅広い知識が求められます。
見習いレベルは、まだ正確な知識や効率的に作業を進めるノウハウが身についていない状態にあります。

見習いレベルの人がやりがちなのは、ゴールからの逆算ができずに闇雲に分析っぽい作業を延々としてしまうパターンです。
あまりデータ分析に明るくない方が見ると、難易度の高い大変な分析作業をしているように感じることもあるでしょうが、
ある程度の経験がある方からすると、見習い分析官の教育的な側面を無視するならば、何の価値もない無駄な作業を沢山しているように感じると思います。

一方、独り立ちレベルにある分析官は、見習いレベルの時に繰り返した手痛い失敗を活かし、ゴールになるべく最短経路で向かうマインドができています。
独り立ちレベルと見習いレベルの分析官の動き方を観察すると、その違いは情報のインプットの差にあると感じます。

・ 独り立ちレベルは実際に作業を進める前に、
過去の類似案件のまとまった質・量の情報収集を高速に行い、分析してから作業を進める
・ 見習いレベルは与えられた情報のみを鵜呑みにし、ただ漫然と作業を進める

独り立ちレベルにランクアップできる分析官は、自分の専門領域のみならず様々な分野に興味関心が強く、日頃から熱心に世界の新しい情報を取り入れているようです。
その日々の積み重ねが正確な知識やノウハウの獲得につながっています。

独り立ちレベルと棟梁レベルの違い

独り立ちレベルと棟梁レベルの違いは、分析結果のアウトプットの質に差があるように感じています。

・ 独り立ちレベルの分析官は、「正しい」ことを伝えることに集中している
・ 棟梁レベルの分析官は、「役に立つ」ことを伝えることに集中している

これは、解決できる課題の価値の大きさに直結します。

価値の大きな課題とは、例えば「この会社をより良くしてほしい」や「この社会をより良くしてほしい」など、
抽象度が高い課題であることが多く、正しさを定義することがもはや不可能になってきます。

独り立ちレベルの分析官は、難易度や抽象度の高い要望を受けた時に、なぜそのプロジェクトが難しいかをアウトプットすることに終始してしまうので、
そこで歩みを止めてしまいます。

棟梁レベルにある分析官は、様々な角度から物事を見ることに長けており、課題設定を作り変えることがとても上手だと感じます。
AIのもつ可能性が(再)発見されたことで、マシーンとヒトの分業構造が急激に変化している現代では、
現実課題をAIが解きやすいように課題設計できる能力は非常に求められています。

棟梁レベルにランクアップできる分析官には、案件や他者とのコミュニケーションを円滑に進められる特徴がありますが、
専門的なサイエンスの知識の深さはもちろん、顧客目線・相手目線・客観目線で考えて行動するマインドが根付いていることが大きな要因のようです。

業界代表レベルと棟梁レベルの違い

業界代表レベルと棟梁レベルの違いは、外部に発信するアウトプットの量に差があるように感じます。

・ 棟梁レベルの分析官が他者に対してアウトプットする場は、主に案件を通したミーティングや報告会のみ
・ 業界代表レベルの分析官は、カンファレンスやシンポジウム、インターネットなどで積極的にアウトプットする

この活動量の差は、その分析官が中心のコミュニティが生成されるかどうかに直結します。
コミュニティには社会をガラッと変えるようなポテンシャルも秘めているため、
一人の分析官が与える影響が業界・社会単位に拡大していきます。

業界代表レベルにランクアップできる分析官は、業界を横断して幅広く分析しており、組織の運営能力も非常に長けているようです。
コミュニティのマネジメントが上手で、メンバ間に相互作用が発生するような働きかけや仕組み作りに多くの試行錯誤をしている印象です。

まとめ

まとめると、次のようになります。

1. 見習いレベルの分析官は発展途上
2. 独り立ちレベルの分析官は正確な知識やノウハウを身につけている
3. 棟梁レベルの分析官はビジネスに大きく貢献できる
4. 業界代表レベルの分析官は社会にインパクトを与えられる

DS協会のスキルレベルも概ね上記のような役割を果たす上で必要な項目を詳細化しているように思います。
数学の知識や計算処理スキルなどの専門的なスキルセットに目を向ける前に、
まずは各階級のデータサイエンティストに求められる大まかな役割を把握し、少しずつ整理していくのがオススメです。