- 会員限定
- 2021/02/22 掲載
5分でわかる「DataOps(データオプス)」の基礎、 どんなメリットがあるのか?
DataOpsとは
皆さんは、DataOps(データオプス)という言葉を知っているでしょうか。この言葉を使い始めたガートナー社の定義によれば、DataOpsとは「組織内のデータ管理者とデータ利用者の間におけるコミュニケーションの向上と、データフローの統合、自動化に重点を置いた手法。共同作業によるデータ管理のプラクティス(実践)を指す」と説明されています。
端的に言いえば、社内のデータ活用をスムーズにするための取り組みのことです。
近年、データ活用の重要性が高まる中、企業として上手にデータ活用をしようと考えるなら、「社内のデータ分析をする部門(業務部門)と、データを収集・管理する部門(管理部門)が協力し、使用ツールや分析プロセスなどを一緒に決め、作業フローを自動化・効率化しましょう。そうやって両部門が継続的に協調する“取り組み方”ができれば、データ活用の生産性向上につながりますよ」というのが、DataOpsの中身です。
DataOpsとDevOpsの関係
DataOps は、DevOps(デブオプス)という言葉から派生したものです。そもそもDevOpsとは、開発(Development)と運用(Operation)を組み合わせた造語で、「ユーザーの利便性を高めるために新しい機能を追加したい」と考えるシステムの開発部門と、「ユーザーの信頼を維持するために安定的に稼働したい(から機能を増やしたくない)」と考える運用部門という、対立しやすい関係にあった両部門が協調することにより、開発をスムーズにしようという取り組みを指します。
そして、このDevOpsのカルチャー(文化)とプラクティス(理論)をデータ分析の分野にも応用しようということで登場したのがDataOpsというわけです。
ほかにも、デザイン領域のDesignOps(デザインオプス)、ビジネス戦略などの領域のBizOps(ビズオプス)、機械学習領域のMLOps(エムエルオプス)など、「xOps」のキーワードはいくつも登場しており、DataOpsはこのうちの1つです。
実際に、DataOpsという言葉が登場しはじめたのが2018年頃。調査・助言会社のガートナー社が発表する「ハイプ・サイクル(特定の技術の成熟度、採用度、社会への浸透度などを示す図表)」に登場したことがはじまりと言われています。登場以来、データ分析や管理に携わる人たちの間で話題を集めています。
DataOpsのメリット
DataOpsにはDevOps で得られるようなメリットがあります。たとえば、DevOpsのように関係部門の協力体制を整備し運用を自動化することで、生産性が向上するメリットがあります。DataOpsの場合も、関係部署間の協力により、データ基盤上の自動化されたフローを整え、全体の80パーセントを占めると言われているほど工数のかかる前処理の分析業務を効率化できれば、データサイエンティストがデータ分析そのものに注力できるようになります。
ただし、DataOpsには、DevOpsとは違った難しさがあります。
DataOpsの場合、データサイエンティストなど分析に関わるテクニカルな部門と、分析データを活用するビジネスサイドの部門との間に知識のギャップあり、これを埋める必要があります。また、データ分析は、DevOpsが課題とするソフトウェア開発の領域よりも、はるかに探索的なプロセスです。継続的デリバリーを実現するためには、プログラムコードに加えてデータを相手にする必要があるため、DevOpsよりパイプラインの実現の難易度の高くなるのです。
両キーワードの共通点は、DataOpsがDevOpsと同様に厳密な規則ではなく「規律に基づくプラクティス」である点です。ガートナー バイスプレジデントのニックヒューディッガー(Nick Heudecker)氏も「DataOpsは標準やフレームワークがいまだ存在しないプラクティス」と紹介しています。どちらも、「これを適用すれば良い」という型が存在しないアプローチと言えます。
【次ページ】「DataOpsが注目されるワケ」「DataOpsの実践に役立つ18のポイント(図解あり)」まとめて解説
関連コンテンツ
PR
PR
PR