0
会員になると、いいね!でマイページに保存できます。
DX推進に伴うAI活用が広がる中で、情報やデータを扱える人材の需要は飛躍的に高まっている。しかし、企業側にとってデータを活用できる人材を見極める術は限られており、人材側にとって専門的な大学を卒業していない限りはスキルをアピールできない。こうした問題を解決するために有用なのがデータの解釈、処理、活用などに関するデータリテラシーを評価する「DS検定」だ。本記事では、DS検定の概要と試験の合格基準・科目別の必要知識とスキル・勉強方法にフォーカスを当てて解説する。DS検定のことを確認したうえで、自分に合った勉強方法を選択して資格取得を目指そう。
DS検定とは
DS検定とは、「データサイエンティスト検定リテラシーレベル」の略称で、一般社団法人データサイエンティスト協会によって実施されるデータサイエンス系検定の1つだ。2021年9月に第1回目が実施された比較的新しい検定で、数理・データサイエンス・AI(リテラシーレベル)の知識やスキルが問われる。DS検定のリテラシーレベルで問われる知識は、「新人データサイエンティスト」または「アシスタント」のレベルに相当する。とはいえ、技術者と現場をつなぐ重要な役割を担うことができ、さらなる専門性を身につける大切なフェーズである。
試験範囲は、大きく分けて「データサイエンス」、「データエンジニアリング」、「ビジネス」の分野に分かれている。細かくは、統計数理基礎、データ加工やデータクレンジング、データ分析、特徴量エンジニアリング、データの活用など、さまざまな知識やスキル
を広くカバーしている。とくに数値を読み解く力、短時間で計算をし、その結果から結論づける力が試されるのが特徴だ。
よく比較されるディープラーニング協会の「
G検定(ジェネラリスト検定)」に対し、DS検定の出題範囲が2割ほど広く、暗記だけでは解けない問題が多いため難易度も若干高いとされる。このため、データ活用人材としての存在感を十分にアピールできる検定といえるだろ
う。
Di-Liteとデータリテラシー
「G検定」と「DS検定」の他によく知られているのが情報処理推進機構の「ITパスポート試験」で、経済産業省はこれら3つの試験を軸に「Di-Lite」と呼ばれるデジタル人材の育成プロジェクトを推進している。
Di-Liteとは、デジタル技術を使う人(ビジネスパーソンや学生)に求められる、「デジタルリテラシーの範囲」のこと。データリテラシーとは、データの中から価値ある情報を見い出し活用する能力であり、それは「データサイエンス」、「データエンジニアリング」、「ビジネス」の3領域に分類可能だ。
より具体的な技術領域として「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」が定義されており、上述の3つの試験が各分野に対応している。それぞれの対応は、以下の通りだ。
データリテラシー |
Di-Lite |
試験 |
データサイエンス |
数理・データサイエンス領域 |
データサイエンティスト検定(DS検定) |
データエンジニアリング |
ITソフトウェア領域 |
ITパスポート試験 |
ビジネス |
AI・ディープラーニング領域 |
G検定 |
上記のようにDS検定は、社会全体のデータリテラシーに関わる検定の1つである。
DS検定の目的と対象者
DS検定の目的は、Di-Liteの一環としてデジタル人材を育成することの他に、合格者がデータサイエンティストに必要な「入門レベル」の実務能力や知識、リテラシーレベルの実力を持っている人物であると証明することにある。検定の対象者は、データサイエンティスト初学者や、これからデータ活用人材もしくはデータサイエンティストを目指すビジネスパーソンや学生とされている。
データサイエンティスト検定ではあるものの「デジタルリテラシー」レベルは、それほど専門的な領域ではないため、G検定やITパスポート試験のようにこれからデジタル人材として活躍したい人材が対象となっており、エンジニアのような技術者以外にも広く門戸が開かれている試験といえる。
DS検定試験の概要
DS検定は、年2回(春と秋)に実施される。直近の試験日程は以下の通り。
試験期間:2022年11月15日(火)~12月5日(月)
申込期間:未定(2022年9月22日時点)
申込方法:未定
受験資格:なし
実施概要:選択式問題・全国の試験会場で開催(CBT)
問題数:90問
試験時間:90分
出題範囲:公式サイト「データサイエンティスト検定の試験範囲」を参照
受験費用(税抜):一般1万円、学生5,000円
2022年9月22日時点で未定の申込期間や申込方法は、定期的に公式サイトやSNSをチェックして確認してほしい。
DS検定のメリット
DS検定を受験するメリットは大きく分けて2つ。1つ目はデータサイエンスに関する入門レベルの知識を有する証明になる点だ。IT分野への就職を希望する学生やキャリアアップを目指すビジネスパーソンにとって大きな武器となるだろう。
2つ目は、ビジネスにおけるデータ活用のスキルを習得することで課題解決力を高められる点だ。デジタル化が進む社会においてデータを使った課題解決力のニーズは極めて高い。仮に検定に合格できなかったとしても、試験勉強を通じてデータに関するリテラシー高めることで、現在のビジネスにおいても、これからのビジネスにおいても、自らの活躍の場を広げる良い機会になるはずだ。
DS検定の難易度と合格基準
DS検定において「データサイエンスに関する入門レベルの知識」とあったが、検定の難易度は具体的にどの程度になるのだろうか。ここでは、他のデータリテラシー検定と比較したDS検定の難易度と、合格ライン・合格基準を解説する。
DS検定の難易度
前述の通り、G検定に比べてビジネス・エンジニアリング・数理統計の知識が多く問われる分、出題範囲はDS検定のほうが広く、難易度は若干高い。さらに、2021年9月より始まった新しい検定であるため、参考書や対策講座など、試験対策の手段も他の試験・検定に比べて数が少ない点も難易度を高くしている要因の1つだ(一方で、G検定では機械学習の手法の1つであるディープラーニングに関する最先端の技術やアルゴリズムの中身を詳細まで問われるため、G検定特有の難しさがある)。
そのため、データリテラシーに関する試験を受ける順番としては、データサイエンスの分野など試験範囲に一部類似点のあるG検定をDS検定の前に受験することがおすすめだ。DS検定は、G検定に比べてビジネス課題の解決力を多く問われるため、G検定の受験後はビジネス、エンジニアリングの分野の学習に力を入れると効率良く勉強できるだろう。
ただし、これは絶対にそうしなければいけないわけではなく、AIに興味を持つ方はG検定、一般的なデータ分析またはエンジニアリングに興味を持つ方はDS検定を先に受験することもある。また、ソフトウェア開発を重視する場合はITパスポート試験を先に受けることもあるだろう。
DS検定の合格ライン・合格基準
DS検定の合格ライン・合格基準は、以下の通り。
2021年9月(第1回)
受検者数:約1400名
合格者数:927名
合格率 :約66%
合格ラインの目安:正答率約80%
2022年6月(第2回)
受検者数:約2900名
合格者数:1453名
合格率 :約50%
合格ラインの目安:正答率約80%
問題集や模擬試験などでは、正答率80%を超えるまで繰り返し問題を解くようにしておきたい。合格率は約66%でG検定とさほど変わない。試験範囲は広いもののきちんと勉強していれば十分に合格できる難易度であることが伺える。正答率80%をクリアするために、事前準備を確実に進める必要がある。
ただし、上記はあくまでも過去の参考値だ。2022年の試験問題は、大幅に刷新予定とされているため、あくまでも参考程度としてほしい。他の検定と比べて歴史が浅いため、試験問題など試行錯誤の部分もあることを踏まえて、受験に備えよう。
DS検定の試験科目と求められる知識・スキル
DS検定全体の難易度や合格ラインを把握したら、次にDS検定の試験科目とそれぞれの科目で求められる知識やスキルをチェックしよう。以降では、DS検定の試験科目ごとに求められる知識やスキルをまとめた。
データサイエンス力
DS検定の中で最も広い出題範囲となる。機械学習の基本概念や機械学習・データ分析の代表的な手法、自然言語処理や画像・映像・音声認識などが問われる。公式サイトで示されている試験範囲は、以下の通り。
統計数理基礎、線形代数基礎、微分・積分基礎、集合論基礎、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、回帰・分類、評価、推定・検定、グルーピング、性質・関係性の把握、因果推論、サンプリング、データクレンジング、データ加工、特徴量エンジニアリング、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、時系列分析、機械学習、深層学習、自然言語処理、画像認識、映像認識、音声認識、パターン発見
データエンジニアリング力
データエンジニアリングは、データサイエンスを意味ある形にできるよう、ITシステムなどとして実装・運用する力を確認するための問題が出題される。試験範囲は、システム設計やデータ抽出・加工やプログラミング力、SQL、基礎レベルのITセキュリティなどだ。公式サイトで示されている試験範囲は、以下の通り。
システム企画、システム設計、アーキテクチャ設計、クライアント技術、通信技術、データ抽出、データ収集、データ構造の基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、前処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、拡張プログラミング、アルゴリズム、分析プログラム、SQL、ITセキュリティの基礎知識、攻撃と防御手法、暗号化技術、認証、ソース管理、AutoML、MLOps、AIOps
ビジネス力
ビジネス力は、ビジネス課題の抽出や解決力だけでなく、プロジェクトの進め方や契約・開発の種別、法規制などに至るまで、幅広い範囲で出題される。公式サイトで示されている試験範囲は、以下の通りだ。
ビジネスマインド、データ・AI倫理、コンプライアンス、契約、MECE、構造化能力、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、AI活用検討、KPI、スコーピング、データ入手、分析アプローチ設計、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント
統計学・数学
統計学は、記述統計学と推測統計学や基礎統計量とその使い分け、二変数間の関係性などが出題される。また、高校レベルの微分や線形代数も試験範囲だ。公式サイトの試験範囲ではデータサイエンス力の中に含まれるが、数学や統計学の知識が薄い場合は、時間を取ってしっかりと勉強する必要がある。
DS検定の勉強方法
DS検定に有用な参考書籍や対策講座の情報は公式サイトでも紹介されている。それらを含めて3つの勉強方法を紹介していく。
公式サイトの例題を確認
DS検定の勉強を始める前に、自分が持つ現状の知識を確認し、どの程度の勉強が必要なのかを把握するため、公式サイトの例題を確認しよう。公式サイトの
模擬問題は、「データサイエンス力3問」「データエンジニアリング力2問」「ビジネス力1問」の構成で、自分の実力を評価するために活用してほしい。各分野の難易度と自分の知識範囲を確認できたら、手薄な部分から順番に勉強を開始しよう。
公式サイトの参考書籍を活用
公式サイトに記載されている以下の参考書籍は、いずれも最新の試験範囲に対応したもので、どちらも受験には必須だ。
データサイエンス分野の初学者なら、公式リファレンスブックを読んで理解を進めてから、検定問題集で自身の理解度を確認する順番で勉強するのがいいだろう。ある程度データサイエンス分野の知識がある場合は、先に検定問題集を解いてみて、自分の弱い分野を公式リファレンスブックで確認しつつ、学習を進めていくと良い。
検定問題集は、全体で80%以上正答できるように何度も繰り返して解く。回答の根拠が分からない部分は、公式リファレンスで何度も確認しよう。また、参考書籍は試験範囲の改定などで新しいものが登場するため、随時チェックするといい。
対策講座を受講
独学での学習が苦手な場合は、対面やオンラインでのDS検定対策講座を受講してみるのも一案だ。公式サイトで紹介されている以下の講座は、いずれもデータサイエンス協会が監修しており、おすすめの対策講座である。
講座ごとに、受講料やオンライン講義・eラーニングなどの違いがあるため、自分のライフスタイルに合った講座を選びだい。またスキルアップAIは、DS検定の対策スマホアプリも提供している。110問の問題をいつでもどこでも解けるため、お持ちのスマートフォンにインストールして活用しよう。
スキルチェックリストで自身のスキルを棚卸
DS検定の公式サイトでは「
データサイエンティスト スキルチェックリスト」を公開している。自身のスキルがどの水準にあるのかを棚卸するうえで非常に有用なリストになっている。無料で手に入るので、ある程度の対策が進めば、一度チェックしてみてもいいのではないだろうか。
データサイエンティストを目指すならDS検定取得を目指そう
DS検定は、現在提供されているデータリテラシー検定の中でも試験範囲が広くやや難しい。試験内容や合格ラインなどを確認し、自分の今の力量を模擬試験や問題集などで確認したあと、自分に合った勉強方法で試験勉強を進めよう。Di-Liteの3大検定の中では最も新しい検定ということもあり、内容が大きく変わる可能性もある。直近の試験概要については、こまめに公式サイトをチェックして、最新の情報を確認したい。
データサイエンティストやデータを活用できるビジネスパーソンを目指すなら、入門レベルという位置づけのDS検定取得を検討してみてはいかがだろうか。
評価する
いいね!でぜひ著者を応援してください
会員になると、いいね!でマイページに保存できます。
関連タグ