1
会員になると、いいね!でマイページに保存できます。
人工知能(AI)を活用した分析の目的の1つに、膨大な情報の中から、人間が見つけ出すことのできない「価値ある情報を見つける」ことが挙げられます。そうした価値ある情報を見つけ出すためには、ある程度整理された「構造化データ」を準備し、AIに学ばせる必要があります。今回は、この構造化データを準備するオントロジー(情報理論)手法のうち、「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説します。
「ヘビーウェイト・オントロジー」とは
私たちがデータを分類したり分析したりする際、代わりにデータを処理してくれるコンピューターですが、コンピューターにも取り扱えるデータとそうでないデータがあります。このうち、コンピューターが取り扱いやすい形に置き換えられたデータを「構造化データ」と呼びます。
人工知能(AI)の場合も同じで、読み込む情報が取り扱いやすい形になっていることが重要であり、かつ有効な分析結果を得るためには、AIに読み込んでもらう情報はなるべく正しく正確なことが望ましいのです。こうした点を踏まえると、最も正確に構造化データを作る方法は、人の手で情報を入力していくという方法になります。
たとえば、医療なら医療、経済なら経済の専門家といったように、各分野の専門家にデータを入力してもらい構造化データを作ることができれば、エキスパートシステムなどの知識を扱うAIは十分な能力を発揮することになるでしょう。
特に、
知識表現などのオントロジー技術を用いたアプローチであれば情報同士の関連性を正しく把握できるようになるため、断片的な情報から知識のネットワークを辿り、価値ある情報にたどり着く「推論」が可能になります。また、専門家ほどではなくとも、一般人が持っている当たり前の感覚、つまり「常識」に関する構造化データを作ることができれば、AIはその常識を踏まえた判断ができるようになるはずです。
こうした考えから、1984年に一般常識をデータ化しAIに教えようとする「Cyc(サイク)プロジェクト」が始まりました。一般常識をデータベース化し、人間と同等のレベルのシステムを構築することを目的とした同プロジェクトは、2020年時点の現在も続いています。
このように、人間が持つ知識の概念を正しくAIに教えようとするアプローチは、「ヘビーウェイト・オントロジー」と言います。
しかし、このアプローチでは、新しい知識が増えたら情報を更新し、誤りが見つかれば修正するなど、その都度人手による調整が必要になります。そのため、この方法は特定の専門領域であったり、情報の変化が少ない分野であったりすれば良いのですが、情報の変化が激しい分野では使えません。それは一般常識についても同じです。そこで、別のアプローチが検討されるようになりました。
「ライトウェイト・オントロジー」とは
AIに学習させるデータを人手で入力していく、という方法が困難なのであれば、AI自らが情報を理解できるようにさせるアプローチがあります。
これは、「ライトウェイト・オントロジー」と呼ばれるもので、AIが自分で情報間の関係性を見つけるというアプローチです。AIが知識の概念を自ら記述できるのであれば、人間の関与は必要ありません。具体的に言えば、AIが今まで扱えなかった非構造データを人間の手を借りずに構造化データにするための試みです。
SNSの書き込みや、使っているタグ、ブログ記事のアクセス傾向、検索エンジンの履歴や画像・動画のタグなど、ウェブ上のあらゆる情報には何らかの関連性があります。無関係なものもあれば、有意義な関係性もあるでしょう。
ライトウェイト・オントロジーのアプローチの場合、無数の関係の中から有意義な関係性を見つけ出します。しかし、人間とまったく違うプロセスで概念を獲得する方法のため、同じ物事に関する知識でも、AIと人間とでは違うものになりえます。同じ「猫」でも、捉え方は人間とAIで大きく異なる可能性があるということです。
ただ、間違った部分や大きく異なる部分だけを修正し、それ以外については勝手に知識を獲得してくれるのであれば非常に有用です。特に近年は機械学習技術が向上しており、機械学習によってライトウェイト・オントロジーの手法も大きく向上しました。Cycプロジェクトにもこうしたアプローチが取り入られるようになって、ようやくプロジェクトの終わりが見えてくるようになりました。
このオントロジーは技術というよりも「手法」についての話であり、実際にはさまざまな手法が組み合わせて使われています。どちらかにきれいに分けられるものではありません。
特に近年の機械学習やデータマイニング技術の向上により、ライトウェイト・オントロジーの精度は大きく向上しました。
正確なヘビィウェイト・オントロジーの手法も使いつつ、機械が学び、さらに精度を向上させて行きます。将来的には機械自ら構造化データを作れるようになるはずですが、それにはもう少し時間がかかりそうです。
ここから先は「ビジネス+IT」会員に登録された方のみ、ご覧いただけます。
今すぐビジネス+IT会員にご登録ください。
すべて無料!今日から使える、仕事に役立つ情報満載!
-
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
-
完全無料
登録料・月額料なし、完全無料で使い放題!
-
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
-
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!
評価する
いいね!でぜひ著者を応援してください
会員になると、いいね!でマイページに保存できます。
関連タグ