• 2020/12/28 掲載

データマイニングがよくワカル、「おむつとビール」のたとえ話とは?

連載:図でわかる3分間AIキソ講座

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
1
会員になると、いいね!でマイページに保存できます。
人工知能(AI)を活用した分析の目的の1つに、膨大な情報の中から、人間が見つけ出すことのできない「価値ある情報を見つける」ことが挙げられます。そうした価値ある情報を見つけ出すためには、ある程度整理された「構造化データ」を準備し、AIに学ばせる必要があります。今回は、読み込むデータが構造化データか非構造化データであるかに関わらず、あらゆるデータから価値ある情報を見つけ出してくれる「データマイニング」と呼ばれる手法について解説します。
画像
データマイニングの理解を深める「スーパーマーケットのおむつとビール」のたとえ話(後ほど詳しく解説します)


「データマイニング」とは

 前回、構造化データを作る手法「オントロジー(情報理論)」のうち、「ヘビーウェイト・オントロジー」と「ライトウェイト・オントロジー」を紹介しました。しかし、このオントロジーは、あくまで「概念」や「知識」に関するアプローチであり、どちらかと言えば、かなり体系化された情報を扱います。言ってみれば、AI専用の辞書を作るような手法です。

 このオントロジー手法をすぐにビジネスの世界に転用できるかというと、微妙なところです。たとえば、同手法によって売れ筋商品を見つけ出させようとしても、まず売れ筋商品の定義を見つけ出そうとしてしまうでしょう。

 ここで言う、売れ筋商品の定義とは、企業にとって価値ある情報になります。完璧な定義を見つけ出すことができれば、その定義に合った商品を探すという方法によって、商品の販売個数の推移などを見ずに、売れ筋商品を見つけ出すことができるかもしれません。

 他方、ビジネスの世界では理由が分からなかったとしても「販売数が急上昇している商品の情報」などが重要になります。そうした情報は、膨大な購買データなどの中に埋もれています。そうした単体だけでは意味をなさないデータの中から、隠れていた新しい「価値ある情報」を見つけ出すような技術を「データマイニング(情報採掘)」と言います。

 データの関係性をプログラム自らが見つけるという点では、前回紹介したライトウェイト・オントロジーと共通していますが、違いがあります。ライトウェイト・オントロジーは情報が持つ「知識」や「意味」を見つけるのに対し、データマイニングは「価値」を見つけようとします。意味は理解しようとせず、価値の有無だけを探すのがデータマイニングです。これはデータを扱う上では非常に重要なポイントです。

 また、データマイニングでは非構造化データを構造化データに変えることもあれば、非構造化データのまま扱うこともあり、データの扱い方もさまざまです。さらに、得られた「価値ある情報」をAIに限らず、人間が利用するケースが多いのも特徴と言えるでしょう。

データマイニングの理解を深める「たとえ話」

 データマイニングの解説によく用いられるのが、「スーパーマーケットのおむつとビール」のたとえ話です。

 あるスーパーがレジで収集した膨大な購買情報をもとにデータマイニングを行った結果、おむつとビールが同時に買われているケースが多いことがわかりました。なぜそうなるのかという「意味」はまったく不明ですが、おむつとビールの棚を近づければ売上アップにつながる可能性を示す「価値」のある情報なのは明らかです。これがデータマイニングの見つけ出す「価値」の一例です。

 つまり、データマイニングは、扱うデータの意味を考えず、情報の中に隠れた価値を見つけ出してくれる手法なのです。なお、データマイニングであれば、構造化データも非構造化データも扱えます。

 ライトウェイト・オントロジーのアプローチで同じことするには、その意味を見つけなければなりません。たとえば、「乳幼児のおむつを購入」「母親は育児に忙しい」「買い物は父親」「仕事帰りに買い物」といった情報を見つけ出し、そこで「仕事終わりの晩酌にビール」という情報の組み合わせが現れてはじめて、おむつとビールが売れるということに気づきます。

 このプロセスは人間にも似ているかもしれません。同じような気づきを得られるプログラムだったとしても、論理的に気づきを得る人間的な手法とデータの関係性から気づきを得る手法では、プロセスがまったく異なることが分かるでしょう。

情報の持つ「意味」と「価値」

 ライトウェイト・オントロジーは「意味」を扱う都合、自然言語処理と深い結びつきがあり、分野が少々狭いです。一方で、幅広い意味での「価値」を探すデータマイニングの適用分野は非常に幅広くなっています。

 根本的な原因を探ったり、現象を正しく理解したりするためには、オントロジーが重要になりますが、単に「価値ある情報」を見出すだけならデータマイニングで構いません。

 さまざまな価値ある商品を扱うビジネスの世界では、おむつとビールのような人間には意味もわからない、しかし「価値のある関係性」が「意味」よりも重要です。また、現象や物事の「意味」の取り扱いに関しては、現時点ではAIよりも人間の方が優れているため、まずはAIに価値ある情報を見つけ出してもらって、その意味は人間が考えることがほとんどです。

 そのうえで、上手く意味付けができれば、それは知識になります。そうなれば、改めてAIに教えなおし、また別の発見につなげることができるようになるかもしれません。

 情報の持つ「意味」と「価値」、似ているようで似ていないデータに隠れた「何か」をAIと人間が協力して見出すことではじめて、情報を余すことなく活用できるようになるのではないでしょうか。
連載一覧

評価する

いいね!でぜひ著者を応援してください

  • 1

会員になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 1

  • 0

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます