- 会員限定
- 2018/10/26 掲載
【取材】データサイエンティストの「スキルの身につけ方」&「育成方法」
データサイエンティストとは何か
データサイエンティストの仕事とは、ひとことで言うと「データの分析に基づいて、ビジネスのさまざまな課題を解決する」ことです。ただ問題を机上で解いて答えを出すだけではなく、最近では機械学習やディープラーニングにより、システムに解決方法(モデル)を実装するところまで含めて、データサイエンティストの仕事になりつつあります。企業で働いているデータサイエンティストは特にこのデプロイメント(システムでの実運用を可能にすること)まで求められますが、これによりデータサイエンティストがより高い付加価値を提供できるようになってきたと感じています。
最近は「データサイエンス=人工知能(AI)」という見方もあり、一部で議論が上がっていますが、私はそれほど間違っていないと思います。最低条件としては、機械学習の基本的な仕組みさえ理解していればいいのですが、やはりそれを応用するためにはもっと知識が必要になります。
時代とともにデータサイエンティストも進化していて、期待される役割も変わってきているということです。企業側からしても、データを見て統計分析することしかできないデータサイエンティストにはすでに魅力に感じられなくなっています。
データサイエンティストは大きく2種類に分けられます。ひとつが先端技術の研究開発を極めようとするデータサイエンティスト。そしてもうひとつが、より事業の近くでビジネス課題を解決し、ビジネスKPIの向上を目的にデータ解析を行うデータサイエンティストです。
つまり、利益に直接は結びつかないものの、先を見据えた研究を行う「研究者」タイプと、実事業にインパクトを与える「ビジネス」タイプに分かれるということです。企業によって所属するデータサイエンティストのタイプは異なりますが、多くの事業会社では後者のビジネス視点に力を入れていることが多いです。あるいは研究系とビジネス系を両方同時に進めている企業もあります。
データサイエンティストの仕事とは?そのタイプもさまざま
まずデータサイエンティストの仕事をイメージしやすいように私自身のやってきたことをお話しすると、たとえば自身で立ち上げた白ヤギコーポレーションでキュレーションアプリ「カメリオ」を作っていたときは、情報のタグ付けや検索の自動化をするためのアルゴリズムを作った上で、それをアプリに実装して提供する、という作業をしていました。その前、ボストンコンサルティンググループ(BCG)に在籍していたときは、個別の案件に入って売上の伸びを予測したり、会社の売上などのデータを見て会社の成長に求められる施策を立案したりしていました。
データサイエンティストの仕事には、「データ収集」「データの前処理」「予測モデル作成」「予測・解釈」「モデル実装」という一連のパイプラインがあります。
少し前までは予測やレポート作成はデータサイエンティストの仕事でしたが、DataRobotを使えば機械学習のプロセスを自動化し、モデルの生成から予測までをやってくれます。このように、データ解析技術はどんどん自動化が進み、これからは、予測モデルから得られた予測結果を解釈・説明したり、どのように事業に実装するのか、ということがデータサイエンティストに特に求められるようになるでしょう。
データサイエンティストになるには?どうやってスキルを身につけるのか
データサイエンティストになるためには、研究者畑から、あるいはビジネス畑からというように、いくつかの方面からのキャリアパスがあります。社内で養成する場合は、金融業では与信モデル作成、製造業では分析寄りのエンジニアなど、すでに分析官の役割をしている方がキャリアチェンジするケースがまず考えられます。
求められるスキルセットについては、データサイエンティスト協会が「ビジネス力」「データサイエンス力」「データエンジニアリング力」という3つの要素があると説明しています。
データ分析では、最初に何をやるのかということは必ずしも決まっていません。それらを探求し、仮説をつくり、インサイトを見つけなければなりません。そのため、何かを深く理解しようとして取り憑かれるような気持ちがないとできないのです。
もちろん技術面では、RやPythonといった言語ができる、ツールが使えるというような基本知識は必要です。アルゴリズムの仕組みをを理解していることも大切ですが、技術だけを追いかけるのではなく、ビジネス力も重要になるのです。
もともと研究畑出身の私にとっては、戦略コンサルティングファームでの経験は、現在の仕事にも強い影響を与えてくれています。
【次ページ】タイプ別・スキルの身につけ方/自社でデータサイエンティストを育てるためにすべきこと
関連コンテンツ
関連コンテンツ
PR
PR
PR