0
会員になると、いいね!でマイページに保存できます。
ビジネスにおいてデータ活用の重要性が増している現在。企業が扱うデータの適切な品質管理も、同様に重要度が高まっている。しかし、ますます複雑化するデータ品質管理に対処するには、従来のデータ品質管理ツールでは不十分なケースも多い。その解決策として、注目されているのが「拡張データ品質管理」だ。同アプローチは従来のデータ品質管理とどう違うのか。そして、導入によるメリットは何か。ガートナー シニア ディレクター, アナリストのメロディ・チエン氏が解説する。
データ品質管理に関する「トラブル」とは
企業・組織がデータ活用を効果的に行うためには、取り扱うデータが信頼性や正確性などの点で質の高さを有し、適切な管理がされていることが必要不可欠だ。データ活用のニーズが社会的に高まるにつれ、そうしたデータの品質管理に関するテクノロジーも大幅に進化している。
データ品質管理の重要性について、「正しいデータ、良いデータをAIモデルに送ることで、世界を変えることもできるかもしれません」と語るのは、ガートナー シニア ディレクター, アナリストのメロディ・チエン氏だ。
チエン氏は、データ品質管理のポジティブな可能性を語る一方で「世界中でデータ品質の問題を原因とするさまざまなトラブルが起きているのも目の当たりにしてきました」とも話し、ネガティブな現状もあることを指摘する。
データ品質管理においては、日々、入力しているデータが自組織のポリシーやベストプラクティスに準拠しているかを確認することが重要になる。ただ、ルールの設計/開発/導入に何カ月もかかったり、すべてのシナリオをカバーするには不十分であることも多く、ルールの再調整に何週間も費やすこともあるかもしれないのが、データ品質に関して現状見られる問題だという。
そのほかにも、追加のデータ環境やユースケースに対応するための拡張が難しかったり、包括的なモニタリングと検出機能が欠如しているといった課題や、データ管理のプロセスが破綻し、スキルが不足しているケースなども見られるとチエン氏は話す。
では、こうしたデータ品質をめぐる多くの課題を解決するためには、どのようなアプローチが有効なのだろうか。
「拡張データ品質管理」とは何か?
チエン氏によると、データ品質管理のプロセスでは「インテリジェンス」、「使いやすさ」、「容易な導入と拡張」、「相互運用性」、「効率化」、「データの民主化」などが求められているという。
こうしたニーズに応えることができるのが、「拡張データ品質管理」と呼ばれるアプローチだ。
「複雑化するデータ品質の課題に対処するには、従来のデータ品質管理ツールでは不十分です。課題を解決する鍵を握るのが、『拡張データ品質管理』ソリューションであり、まったく新しいプラクティスデータ品質管理プロセスにもたらします」(チエン氏)
この拡張データ品質管理、具体的にはどんな機能を意味するのだろうか。
チエン氏によると同アプローチは、アクティブ・メタデータ、AI/ML、グラフ・アナリティクス、NLP(自然言語処理)/LLM(大規模言語モデル)などを活用して、データ品質管理エクスペリエンスを向上させる一連の機能を指すという。導入の主なメリットとして挙がるのは以下の4点だ。
- メタデータ・ドリブンの自動化
- AI/MLドリブンの拡張
- ナレッジ・グラフの洞察
- NPL/LLMドリブンのアプローチ
また、拡張データ品質管理が存在する領域としては「統合データ管理基盤」、「スタンドアロン型データ品質管理ソリューション」、「データ品質管理サービス」があるという。
「拡張データ品質管理は、データ品質管理やMDM(マスターデータ管理)、メタデータ管理などデータ管理機能を含む統合基盤、汎用的なデータ品質管理向けに独立したビジネス指向のデータ品質管理ソリューションにも含まれます。また、他のツールと相互運用できるため、API経由やWebサービスなどで活用されるサービスとしても利用可能です」(チエン氏)
【次ページ】拡張データ品質管理がもたらす「4つ」のメリット
関連タグ