データサイエンティストの要件

データサイエンティストに必要なもの

Data Science Online Course

東京大学グローバル消費インテリジェンス寄付講座主催のData Science Online Courseは社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者とした東大のデータサイエンティスト/未来のCMO育成講座の社会人向けオンラインコースです。

オンラインコースの第一回はデータサイエンスの説明だったのですが、その中ではデータサイエンティストは下記のように説明されていました。

ビジネスの課題に対して、統計や機械学習(数学)とプログラミング(IT)スキルを使って、解決する人

参考としてリンクが付記されていました。データサイエンティストのスキルセットのイメージと解説が記載されています。

image.png

解説によれば、データサイエンスとは、高度な数学と統計、プログラミングおよびモデリング技術とを組み合わせ、エンタープライズクラスのツール、テクノロジーアーキテクチャ(すなわちコンピュータサイエンス)を活用することですが、それらの能力だけでは不十分で、ビジネスドメインを深く理解することによって、立てた仮説を実際の現場に適用することができるのだ、とのことです。

次のリンクにはデータ分析のプロセスの図が掲載されています。 image.png 講座では、重要度が高いのはビジネス理解であり、モデリングだけしていてはいけないということを強調していました。

データサイエンティスト協会

データサイエンティスト協会のプレスリリースでは、データサイエンティストを下記のように定義しています。

「データサイエンティストとは、データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」

こちらにも似たような図が登場します。3つの丸の一番上に「ビジネス力」が来るように、ビジネス力はかなり重視されていることがわかります。 キャプチャ.PNG

データサイエンティストとは

データサイエンティストの定義はどちらもほぼ同じ定義ですが、どちらも述語が「ビジネス課題を解決する」になっています。つまり、ただの統計屋でなく、ただのエンジニアでもなく、ただの企画屋でもない、これらの力を組み合わせてビジネスの課題解決まで導ける人がデータサイエンティストということになります。

キャプチャ.PNG

ビジネスの世界で生きていく以上は、自分は分析だけできればいい、なんてわけにはいかないようです。