会員限定
2017/08/28 掲載

PFN 奥田遼介氏が解説、ディープラーニングだけでなく「強化学習」も活用する理由

ありがとうございます！
いいね！した記事一覧をみる

会員になると、いいね！でマイページに保存できます。

ロボティクス

|

タグをもっとみる

ディープラーニングのOSSフレームワーク「Chainer」やその中のライブラリ「CuPy」の研究・開発などに携わり、いま日本のAIを支えるキーパーソンの一人に数えられるようになったのが、Preferred Networks（以下、PFN）チーフアーキテクトの奥田遼介氏だ。同氏は東北大学の学生時代から教育用ロボットを活用し、そのときの経験が現在の仕事でも生かされているという。奥田氏はロボットカーやアマゾンのロボット大会などの具体的な事例をもとに、機械学習や強化学習がどう活用されているのかについて解説した。

教育用ロボットキットを活用してAIを学ぶ

Preferred Networks（PFN）
チーフアーキテクト
奥田遼介氏

　教育用ロボットキット「LEGO MINDSTORMS」を手がけるアフレル主催の「Robotics Education Day 2017」に登壇した奥田氏はまず、東北大学在学中、組み込みソフトウェア技術を競い合う「ETロボコン2012」のチャンピオンシップ大会に出場してきた当時を振り返った。

　学生時代にETロボコンで培ったノウハウを、現在の仕事でも活用しているという奥田氏。かつて開発したETロボコン用の自動パラメータ装置は、競技で使うライントレース用の倒立振子学習ロボットを釣り上げ、うまく走行できるようにパラメータをリトライで自動調節した。

ETロボコン用の倒立振子学習ロボットを上手く走らせるために、ロボットの制御パラメータを自動調整させる装置を開発した

「ロボットが倒れたら、釣り上げて、倒れないで上手く走れるようになるまで延々とパラメータを調整する。そのために、プログラムのリモート書き換え機能も実装している。PCからBluetoothでパラメータをロボットに転送する専用スクリプトも書いた」（奥田氏）

　ご存じの方も多いだろうが、同氏が在籍するPFNは、NTT、ファナック、トヨタ自動車も出資するAIベンチャーの雄だ。製造業やヘルスケア、自動車などの産業分野に機械学習技術を適用し、実データを用いた共同R&Dプロジェクトをいくつも立ち上げている。

ディープラーニングだけでなく、強化学習も必要になる理由

関連記事

▲ 閉じる ▼ すべて表示

　ここで少しAI関連の用語を解説しておこう。

　まず機械学習は、目標とする問題設定に対して、実データ（教師データ）を使って繰り返し学習させることで賢くなるというものだ。たとえば、手書き文字データを入力して機械学習にかけると、その文字を精度よく認識できるようになる。一方の強化学習は、試行錯誤を通じ、環境に適した制御を獲得する。話題の深層学習（ディープラーニング）は、前出の機械学習手法のひとつであり、近年になって大きな進展が見られる分野だ。

「ディープラーニングによって画像認識率が向上し、現在では3.56％までエラー率が下がっている。同様のタスクを人間が行うと5.1％のエラーになる。つまり現在は、機械学習のほうが人間よりも画像認識の精度が高くなっている。ディープラーニングでは、100万枚の画像をデータセットとして使える。膨大な量のデータを学習させることで、人よりも精度が劇的に良くなった。ただし、画像データに対して、それが何であるかということを人間がタグ付けをしているため、その準備はかなり大変だ」（奥田氏）

　たとえばロボットで動くデモをつくろうとする際には、適当なデータセットが見つからないという問題もあった。そこで、これらの課題を解決するために利用されるのが強化学習フレームワークだ。

　エージェント（ロボット）に周囲情報を与え、スムーズに動けば（良い結果なら）正の報酬を、逆に何かに衝突したら（悪い結果なら）負の報酬を与える。ある状態のときに、どんな行動を取れば正解なのかを、報酬を手がかりに学習させるわけだ。こうすればデータがない環境からも、いろいろな問題に取り組んで正解を出せるようになる。

　強化学習では、前処理したデータをディープラーニングやSVM（サポートベクターマシン）などの学習処理に入力し、さまざまなサービスに反映させる形だ。これがエージェントの行動となる。たとえば、ロボットやゲームAI、自動運転車の動きであったりする。それらの行動から、またデータが生み出され、多くのデータ収集し、学習させるという一連のループを回せるようになる。

強化学習のモチベーションは、データ、学習、行動のループを自動で回していけるようにすることだ

【次ページ】ロボットカーの仕組みとは？どう制御しているのか

PFN 奥田遼介氏が解説、ディープラーニングだけでなく「強化学習」も活用する理由

教育用ロボットキットを活用してAIを学ぶ

ディープラーニングだけでなく、強化学習も必要になる理由

「サイボーグ技術」が現実に、メルティンMMIは「身体的な制約」を突破する

人類初の宇宙レース！HAKUTOが「日本でなければ実現できなかった」と語る理由

生成AIで「ロボット」はここまで進化した、早大尾形哲也教授が語る「2050年の世界」

関連コンテンツ

無法地帯だった「横浜の町工場」が大激変、5年かけた「職場と人材」の大改革とは

現場は阿鼻叫喚「物流の2024年問題」、AIやロボットの導入が喫緊の課題であるワケ

創業60年超えの町工場が「システム総刷新」、大失敗を経て挑んだ「6つの改革」とは

デンソーが開発する「生成AIロボット」とは、トヨタ生産方式で激変する「未来の製造」

自動車メーカーの「人型ロボット」競争が過熱中、中国EV工場「9割自動化」の凄い実態

人気のタグ

PFN 奥田遼介氏が解説、ディープラーニングだけでなく「強化学習」も活用する理由

教育用ロボットキットを活用してAIを学ぶ

ディープラーニングだけでなく、強化学習も必要になる理由

「サイボーグ技術」が現実に、メルティンMMIは「身体的な制約」を突破する

人類初の宇宙レース！HAKUTOが「日本でなければ実現できなかった」と語る理由

生成AIで「ロボット」はここまで進化した、早大 尾形哲也教授が語る「2050年の世界」

関連コンテンツ

無法地帯だった「横浜の町工場」が大激変、5年かけた「職場と人材」の大改革とは

現場は阿鼻叫喚「物流の2024年問題」、AIやロボットの導入が喫緊の課題であるワケ

創業60年超えの町工場が「システム総刷新」、大失敗を経て挑んだ「6つの改革」とは

デンソーが開発する「生成AIロボット」とは、トヨタ生産方式で激変する「未来の製造」

自動車メーカーの「人型ロボット」競争が過熱中、中国EV工場「9割自動化」の凄い実態

人気のタグ

生成AIで「ロボット」はここまで進化した、早大尾形哲也教授が語る「2050年の世界」