0
会員になると、いいね!でマイページに保存できます。
現在、ChatGPTの利用が禁止されている企業において、OpenAIのAPIを通じて自社でAIアプリケーションを開発する動きが出てきている。中でも注目されているのが、「AIエージェント」を活用したアプリ開発だ。アプリ開発に活用できるAIエージェントフレームワーク「AutoGen」を、マイクロソフトが発表したことも話題を呼んだ。進歩の動き著しい生成AI活用の最新動向を解説する。
ChatGPTを“使わない”生成AI活用とは
米国企業では、データ漏えいなどの懸念から、社員のChatGPT利用を禁止するという事例が多数見られる。一方で、経営層における生成AIに対する期待は高まっており、ChatGPTを使わない生成AIの取り組みの事例が増えている。
その多くが、API経由でChatGPTを駆動するOpenAIの大規模言語モデルGPT-3.5やGPT-4にアクセスし、カスタマイズしたチャットボットやアプリケーションを社内外に展開するというものだ。
2023年6月に発表された、ベンチャーキャピタル大手セコイアキャピタルの
調査によると、調査対象となった企業の94%が大規模言語モデルのAPIを使用していると回答。このうち、OpenAIの大規模言語モデルAPI利用が91%と圧倒的な人気であることが分かった。
一方、
AnthropicのAPIを利用している割合も15%に増加しており、関心が高まっていることが示された。さらに、OpenAI、Anthropic、Cohereなどの大規模言語モデルAPIを複数利用している企業が存在することも確認された。
また、API利用が非常に多い中、本番環境で生成AIアプリケーションを運用する企業の割合は65%と、2カ月前の50%から増加していることも判明しており、ChatGPTを利用せずとも、何らかの生成AIアプリケーションを開発し、利用している企業が増えている状況が明らかになっている。
同調査では、生成AIアプリケーション開発において、企業は独自の文脈に沿って大規模言語モデルをカスタマイズしたいと考えており、関連インフラを開発するスタートアップへの関心が高まりつつあることも示唆されている。
大規模言語モデルをカスタマイズする「3つの手段」
現在、大規模言語モデルをカスタマイズする手段は3つある。
まず最も難しいとされるのが、ゼロからカスタムモデルをトレーニングするというものだ。
これには、高度な知識を持つ機械学習研究者、トレーニング用のデータ、トレーニングインフラストラクチャ、コンピューティングパワーが必要とされ、一般的に豊富な資金力と人材を持つテック大手のみが実施できるアプローチとされる。
テック大手以外で、このアプローチで成功した事例としては、自社の金融データによってトレーニングされたブルームバーグのBloombergGPTが挙げられる。ブルームバーグは、この取り組みにおいて、Hugging Faceのオープンソースツールを活用したと言われている。オープンソースツールの改善が進むことで、同様のカスタマイズ取り組みが増える可能性がある。
これに続き、中程度の難度とされるのが、ベースモデルを微調整してカスタムモデルをつくるというアプローチだ。
この方法は、事前にトレーニングされたベースモデルに対し、ドメイン固有のデータを使った追加トレーニングを行うことで、モデルの重み付けをアップデートするというもの。
オープンソース領域におけるイノベーションにより、以前よりも実行しやすい環境となっているが、高度スキルを持つ人材チームを編成する必要があり、ゼロからトレーニングするよりも難度は下がるが、依然難しいアプローチと言われている。微調整のやり方を間違ってしまうと、モデルの挙動が不安定になるといった問題が報告されており、実行できる企業は少ないとされる。
そして、ほとんどの企業が実施しているのが3つ目の最も難度が低いアプローチとなる。
このアプローチは、データをEmbeddings(埋め込み)と呼ばれる手法で変換し、それらをベクトルデータベースに保存、クエリが発生した際にベクトルデータベース内で最も関連性が高い情報を検索し、モデルに返すというものだ。ChatGPTは、2021年9月以降の情報を知らないが、このアプローチにより、GPTモデルに新しい情報を追加し、検索できるようになる。
【次ページ】MSが発表した「AIエージェントフレームワーク」とは
関連タグ