• 2024/10/23 掲載

絶対知りたい“次”の生成AI、「次世代LLM」「エッジ駆動」「動画RAG」とは?(2/3)

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
11
いいね!でマイページに保存して見返すことができます。

次世代LLM(大規模言語モデル)の「o1」をどう解釈する?

 生成AIに関する大きなニュースの1つは、何といってもOpenAIからリリースされた次世代LLM(大規模言語モデル)の“o1”です。ChatGPTの有料サブスクリプションユーザーには機能が即日開放され、すでに使い始めている人も多いはずです。

画像
OpenAIからリリースされた次世代LLM(大規模言語モデル)のo1
(Photo:Robert Way/ Shutterstock.com)

 これまでのLLMの進化は、主にデータ量とモデルのパラメータ数の拡張に基づいてきました。大規模なテキストコーパスを学習し、膨大な知識を持つことで、人間に近い文章生成能力や、会話の文脈を理解する力を向上させてきたのです。

 しかし、こうしたモデルには依然として「推論」の面で限界がありました。つまり、表面的な情報の整合性を保ちながら生成を行う一方で、深い洞察を伴う推論や、複雑な関係を理解する能力は限定的でした。

 ここで登場したのが、o1です。OpenAIによると、o1は単により多くのデータを処理する力ではなく、「推論強化」という次のステージへの進化を実現したとしています。LLMの次の段階が推論強化である理由は、生成AIが単なる知識の出力マシンから、より高度な意思決定を支えるツールへと進化するために必要不可欠だからです。

 従来のLLMは、データからの学習によってパターンを理解し、そのパターンに基づいて生成を行います。しかし、複雑な意思決定や状況の変化に柔軟に対応するには、単なるパターンの再現では足りません。

 たとえば、金融業界の顧客行動分析やリスク評価では、過去のデータにない状況に直面することが頻繁にあります。そのため、単なる既存データの生成に留まらず、未知の状況への対応を見越した推論能力が求められるのです。

 推論強化により、AIは既存の知識を再利用するだけでなく、少ない情報から新しい洞察を導き出す能力を持つことが期待されます。たとえば、不確定な状況や未知の変数がある環境でも、適切な結論を導き出す力を持つようになるかもしれません。

 そうすると、生成AIはより複雑なシナリオに対応できるようになり、AI自体が意思決定の主要なプレーヤーとなり得るでしょう。

エッジデバイスでのLLM稼働が現実に、金融はどうなる?

画像
メタがリリースしている言語モデル「Llama 3.2 3B」はiPhoneやAndroidの上位機種でローカル稼働させることが可能
(出典:筆者提供)
 LLMといえば、クラウド環境で巨大な電力を消費しながら稼働するイメージがあります。実際にはこの2024年に入って相対的にフットプリントの小さなSLM(相対的に小型の言語モデル)が続々と登場しており、プライベート環境で動かすことも珍しくなくなってきました。

 現時点では、未だ精度などの性能は限定的ではあるものの、スマホのみで動くサイズの言語モデルも出現しています。たとえば、メタがリリースしているLlama 3.2 3Bという言語モデルは、iPhoneやAndroidの上位機種でローカル稼働させることが可能です。筆者も実際に動いているiPhoneの実機を触ってみましたが、実用に耐えるレベルのレスポンス速度でした。

 グーグル、アップルともに、OSに生成AIの機能を組み込むことを発表しており、2025年以降、スマホをはじめとするさまざまなエッジデバイス(スマホやIoTデバイスなどの機器)で言語モデルがローカル稼働することが普通になっていくでしょう。

 これは、ユーザーとのインタラクションの質を根本的に変える一大転換となるかもしれません。つまり、単に処理速度が速くなるだけではなく、ユーザー体験全体がリアルタイムでダイナミックに進化するということです。

 例をいくつか考えてみましょう。金融アプリがユーザーの動きをリアルタイムで捉え、瞬時にフィードバックを返すことができるようになると、たとえばポートフォリオの状態や市場の動きに基づいて、その場でリスクを通知したり、アクションを促すことができるようになります。

 これまでの金融サービスが提供していた「一方通行のアドバイス」とは違い、ここではユーザーの動きが即座に反映され、その反応が次のアクションを導くという、リアルタイムのフィードバックループが回せるというわけです。

 あるいは、その場での「インタラクティブなコーチング」もできるようになるかもしれません。たとえば、あるクレジットカードを使おうとしたときに、今の予算状況に応じて「この支払いは翌月の家計にどれだけ影響するか」を即座に知らせてくれるとしたら、どうでしょうか。

 これまでは後になって支出を振り返るしかなかった場面でも、その場でAIが判断を助けてくれるわけです。これは、もはや単なるAIアシスタントではなく、個別のファイナンシャルガイドがポケットの中にいるようなものです。

 エッジデバイス上での生成AIは、リアルタイムかつインタラクティブな体験を提供し、金融サービスのパーソナライズや効率化を飛躍的に向上させるはずです。

 瞬時に応答し、プライバシーを保ちながら個々のデータを安全に処理することで、より親密で、より個別化された金融サービスを提供できる。これにより、金融機関は一段上の顧客体験を実現し得ることでしょう。 【次ページ】動画RAG(Retrieval-Augmented Generation)と金融機関
関連タグ タグをフォローすると最新情報が表示されます

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます