0
会員になると、いいね!でマイページに保存できます。
ゲームAI開発者の三宅陽一郎氏と、グラフィッククリエイターの森川幸人氏に、いま知っておくべき人工知能に関わる重要キーワードを分かりやすく解説していただく本対談。後編は、両氏の専門分野であるゲームAIから、AIの倫理まで、幅広い話題にわたってひも解いていただいた。これさえ押さえておけば、あなたもAIの基礎がマスターできるはずだ。
教師なし学習:人間が見つけられない正解を見つける可能性もある
三宅氏:AIの学習アルゴリズムは主に「教師あり学習」と「教師なし学習」に大別されます。教師あり学習は、AIが何をすればよいのかという「教師信号」を、あらかじめ人間が与えます。たとえばVR空間で犬をつくり、「お手」といったときに「お座り」をするとNGというように正解を教えるものです。
一方、教師なし学習は、自らAIが環境のなかで正解を導き出します。暖かい地方に行きたいときに「北に向うと寒いので南に行く」というように、AIが答えを出します。教師あり学習は、教師信号をつくる必要があるため、人間が張り付かないといけません。教師なし学習は、問題設定をする必要はありますが、学習を始めたら、極端にいえば人間は何もしなくてよいのです。
森川氏:ニューラルネットワーク(NN)は通常は教師あり学習です。しかし、私は教師なし学習のほうが好きです。教師あり学習の場合、教示信号を使うことが足かせになり、AIの学習を制限する可能性があるからです。教師なしで、AIが自分で学習するほうがブレイクスルーが生まれて、面白いと思いますね。
三宅氏:教師なし学習は、人間が見つけられない正解を見つける可能性もあるということですね。何か人間の盲点となるものを持ってきてくれるかもしれません。
森川氏:実は、これは人間の頭の中でも起きていると思います。突拍子もないアイデアが降りるのは、人間の理性からフッと意識上に飛び込んでくるから。教師あり学習が理性ならば、教師なし学習は理性下にあり、面白い思いつきはこちらに近いような気がします。
三宅氏:やはり教師の言われた通りにやっていたら伸びませんよね。芸術の世界は無限の選択肢があります。そこから正解を見つけることは、コンピューターでは難しいですね。
森川氏:本当は教室なし学習でも、何かを選択する際には、サイコロを振って決めるようなものです。ですから異なるフィルターがかかるとか、違う仕組みがあると、もう少し効率的になると思います。
三宅氏:AIは、人間を離れて自分で進化していくようなSF的なイメージを持つ人もいるでしょう。そういうわけで、教師なし学習を一言でまとめると、ワクワク感があり、いろいろな可能性が広がるものだということを覚えていただければと思います。
AlphaGo:モンテカルロ木探索法とディープラーニングを組み合わせ
三宅氏:AlphaGoは、グーグル傘下のディープマインド社が開発した囲碁AIです。2016年に韓国のプロ棋士に勝って、ほぼ人間を超えたことを印象づけました。囲碁は19×19のマス目に白黒の石を置くため、将棋やチェスと比べて探索空間が広く、10の330乗もある打ち手から正解をみつけなければなりません。
森川氏:10の330乗というとピンきませんが、ありえないほど大きな数ということですよね。宇宙が始まってから1回ずつカウントしても終わらないぐらいの話です(笑)。
三宅氏:もう1つ囲碁AIが難しいのは、碁石に個性がない(白と黒しかない)点です。頼りにできる位置から少し外れると局面がガラリと変わります。ぱっと盤面を見て、どこに打てば一番良いかを評価することが難しかった。そんな囲碁AIが変わったのは2006年に「モンテカルロ木探索法」が再発見されてからです。試合を繰り返して得られた勝率を評価することで、劇的に進化を遂げたのです。そのモンテカルロ木探索法とディープラーニングを組み合わせものがAlphaGoです。
森川氏:モンテカルロ木探索法は、ルート選択の分岐が、木の形にようになっています。分岐の部分がルーレットのような仕組みで、博打のメッカがモンテカルロだったので、そういう名前で呼ばれるようになりました。ランダムにどんどん打って、勝率を見ながら、どのルートがよいのかを学習していきます。
三宅氏:AlphaGoの学習過程は2つあります。第一段階では何万もの囲碁の棋譜をひたすら学習し、プロ棋士とそっくりに打てるようにします。これは教師あり学習です。それを学習してしまうと、第二段階の教師なし学習によって、自己発展の段階に入るわけです。囲碁AIは24時間、自分自身と戦い続け、強化学習を行います。人間が一生かかっても打てないほどの試合をこなし、試行錯誤しながらアルゴリズムを改良していきます。
森川氏:最初は、人間が学習した棋譜データを使って学習するので、教師信号になるわけですね。次に自分と戦うプロセスは、生物では無理です。3000万回も通しで戦うことはできませんから。ここから人間があずかり知らない教師なし学習になります。相手に勝っても、勝った理由を人間に教えてくれない点が未来的というか、面白いと感じました。
三宅氏:そうですね。NNなので評価値を出力するまでの間で、一体何をしているのか、実はよく分かりません。AlphaGoだけが見ている囲碁の本質を、人間が何らかの形で抜きだせない限りは、すごく惜しい感じがします。AlphaGoを一言でいうと、人間の気づかないことまで気づけるAIということになります。
自動会話システム:惜しい! あと一歩の進化が難しいのが実情
三宅氏:自動会話システムは、アップルの「Siri」や、マイクロソフトの「りんな」のように、人間と話せるAIです。チャットの文字だけでなく、音声に対応することもあります。自動会話には、語彙をどう組み合わせるかという学習が必要になります。
自動会話システムには本質的な難しさがあります。たとえば百科事典の用語は、データさえあればAIも使えます。しかし、AIが最も苦手とするのは、会話の流れや文脈を把握することです。空気を読みながら、ここで言うべき気の利いたことを言えません。
森川氏:いまAIが会話をする際には、たとえば人が「りんごは好き」と聞いたら「みかんが好き」と反応を返すぐらいのレベルです。りんごは果物で、他にも果物はあるから、「好き」という言葉に反応し、データベースから果物の名前を拾っているだけです。「何でそんなことを聞くの?」といった、人に対する深い考察はできません。会話の間で分断されてしまうからです。
三宅氏:そうですね。以前はデータベースにデータが蓄積されたら、AIもどんどん賢くなると考えられていましたが、会話に関してはそうでもありませんね。もっと他に本質的な問題があるわけです。
森川氏:たとえ意味の解析が正確にできるようになっても、それで楽しい会話ができるかというと、まだ難しいですね。たとえば人が「遊びに行こう」と誘ったときに、AIが「いいよ」と応えても、相手の本当の気持ちまでは推測できません。人間は声のトーンや間、表情など、微妙なニュアンスまで読み取れます。そういう点では難易度は高そうです。
三宅:この分野は7割まで上手くいっても、残り3割を詰めるのがすごく難しい。それっぽいところまでいくのですが、何かがちょっと違う。それを詰めていくのが大変。森川さんは、AIでチャットができる「てきとうパパ」というアプリを開発していましたね。
森川氏:あれはWikipediaのデータを使っていますが、人と会話している雰囲気は出ないですね。三宅さんが言われたように、あとの3割が厳しい感じです。誰か課題を解決してくれる天才が出てきて欲しいですね。
三宅氏:自動会話システムを一言で表現すると惜しい。惜しい線までいっているのですが、あとちょっとが難しいということです。
【次ページ】自律型AIはロボット工学をヒントに生まれた
関連タグ