- 会員限定
- 2019/03/13 掲載
軍事産業に活用される人工知能(AI)、これからの10年で何が変わるのか
連載:軍事産業の新潮流
諜報機関がAIを活用するのは当然のこと
実際には、人間が評価できるようなプログラムを作成するためのルールを定義するのは非常に難しい。AI研究は80年代後半、徐々に衰退したが2000年代に入りコンピューターの能力が向上、マシンラーニング(機械学習=ML)として知られるようになると、AIに対する関心が高くなり再び注目が集まるようになった。
MLではコンピューターが自ら「学習する」。そして、アナリストがオープンソース(公開情報)でアクセスするデータ量に圧倒され、その中からより多くのデータを分析する場合、MLは効果的かつより良いパフォーマンスを発揮する。MLの誕生は1950年代にさかのぼるが、本当の意味で効力を発揮するためには高度な処理能力が必要とされるため、2000年代半ばになってようやく、商業利用として活用できるようになった。
リサーチやアプローチ方法は変化したが、AI研究が対処しようとする根本的問題の多くは日本政府がFGCSを提唱した当時のものとほとんど変わっていない。そのプログラムの目標とは、自然言語処理、自動音声認識、インテリジェント画像分析、機械翻訳などである。
AIに取り組む研究者のモチベーションは「ヒューマン・マシン・インターフェース」を改善することだったが、情報収集によって集められた膨大なデータを処理しようする情報機関がこうした技術を活用したことは驚くに当たらない。こうしたAI技術は一般の人々も利用可能になっており、その進歩はめざましく、多くのユーザーがもはやそれをAIとは思わないほどである。
高精度の自然言語処理が「言語の壁」を破壊する
自然言語処理とは、自然かつ自由に記述されたテキストコミュニケーションをコンピューターが解釈する能力のことである。特徴的なものとして、スラングや文法的な誤り、理解しづらい言語を含んだ複雑な文章などに対応するコンピューター能力もこれに含まれる。自然言語処理は現在、普及するレベルまで進化してきた。たとえば、航空会社のWebサイトを訪れる際、ユーザーの予約作業を支援する「チャットボット」は日常的な例の一つである。
自動音声認識は自然言語処理の一部と見なすことができ、音声で与えられた命令を理解する能力を意味する。アクセントの誤り、書き言葉と話し言葉の違いなどを理解する能力も必要になる。もう一つの見えにくい課題は、音声データの品質が劣っていることがあり、バックグラウンドの騒音が含まれていたり、音声の範囲全体がカバーされていなかったりすることもある、という点だ。
インテリジェント画像認識とは、画像のレビューとカテゴリ分けを意味する。この技術は現在日常的に利用されている。グーグルのリバースイメージサーチツール(画像検索)はある画像が他のWebサイトで使用されている例を見つけるために利用され、ネット上でオリジナル画像である最も可能性が高いものを特定し、それが目印を含んでいればそのロケーションを示す。
諜報分野の活用例として、ネット投稿された動画をフィルタリングし、特定のイベントのビデオに使用されているといったことを識別することができる。別の活用例は顔認識で、無関係と思われる複数の画像の同じ人物を特定するために使われる。
FGCSの「問題」は機械翻訳である。言語間の翻訳には多くの自然言語処理の落とし穴がある。しかし、AIを利用すれば一つの言語から別の言語にテキストを翻訳し、判読できる結果を生成することができる。Google翻訳やBing翻訳のようなサービスはテキストやWebサイト全体を、2010年代初頭には少なくともオープンソースでは不可能だった精度で、自動的に翻訳することができる。
従来、諜報部門のアナリストには外国語のテキストや音声を解釈するための高い言語能力が求められていた。もちろん機械翻訳はまだ言語能力の必要性を排除したわけではない。しかし、アナリストがある文書に含まれる情報の基礎レベルにアクセスするために、その言語に高度な流暢(りゅうちょう)さを備える必要はなくなった。機械翻訳はまた、異なる言語の複数ソースもすべて共通言語に翻訳し単体の証拠として分析できることもできる。
AIが人間レベルで「データを理解する」という神話
このような機械翻訳の技術はすべて、ある程度MLに依存している。AIの初期の用途とは違って、MLではコンピューターが実践によって学習する。たとえば、コンピューターに人の写真を特定するよう教えるために、一方は人を含み他方は含まない2組のデータが用意される。プログラムは2つのグループを区別するために使用する変数を算出する。
「見たこと」のない写真がプログラムに示されると、プログラムはルールを適用し、ある人物が含まれているかいないかによってその新しい画像をカテゴリ分けする。テキストや音声にも同じ原理が適用される。これは説明のための例として便利なものだが、MLには別の形のものもある。
MLを使用するコンピューターには同じタスクを実行する人間に比べて明らかな優位点がある。MLはいくつかの入力(たとえば写真)を取り込んでそれらをグループ(たとえば、人を含んでいるかいないか)にカテゴリ分けするのが非常に得意だ。コンピューターは膨大なデータに対してこの作業が可能で、その実行に時間がかかればかかるほど、より多く「学習する」。
MLをベースにした、あるいは組み込んだソフトウェアツールはすでに多くのユーザーのオンライン体験になじみのものであり、グーグルが提供する「インテリジェント」ツール群がその顕著な例だ。
しかし、この世代のAIは「認知的」だというある種の神話が存在する。この言葉は、AIが人間に迫るレベルでデータを理解することを暗示している。この誤解は、この分野に関わる企業向けのマーケティング素材で主張されていることやMLに内在するプロセスの概念的困難と関連しているかもしれない。
人間の知性と従来のAIとの主な違いは、後者は文脈を理解できないという点である。人間は情報の断片を取り入れて目標や計画、信念、幅広い文脈を暗示することができる。その論拠は必ずしも妥当ではないが、抽象的である。
MLは遭遇したことのあるデータしか考慮に入れることができないため、こうした抽象概念を活用できない。MLはパワフルなツールであるが大きく誤解されているものでもあり、その成熟性の現状を考えれば、誤って伝えられているときもあると言える。
【次ページ】スキルを備えた人間のほうが有効なケースとは
関連コンテンツ
関連コンテンツ
PR
PR
PR
今すぐビジネス+IT会員にご登録ください。
すべて無料!今日から使える、仕事に役立つ情報満載!
-
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
-
完全無料
登録料・月額料なし、完全無料で使い放題!
-
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
-
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!