• 2024/10/23 掲載

絶対知りたい“次”の生成AI、「次世代LLM」「エッジ駆動」「動画RAG」とは?(3/3)

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
11
いいね!でマイページに保存して見返すことができます。

動画RAG(Retrieval-Augmented Generation)と金融機関

 動画RAGは、AIの生成モデルに動画データの「検索」と「生成」を組み合わせる技術です。これまでのテキストや画像に続き、動画データの特定の瞬間や情報を検索し、そこから意味のあるコンテンツを生成することを可能にします。

 テキストベースのRAGが、外部の情報源を取り込みながら応答の精度を高めるのと同様、動画RAGは膨大な動画ライブラリの中から特定のクリップやフレームを抽出し、適切な文脈に基づいた生成を行う仕組みです。

 従来、動画データはテキストや画像と異なり、検索や内容の理解が難しいとされてきました。

 動画RAGの特徴は、動画の内容を視覚的にキャプション化し、そのキャプションやメタデータに基づいて適切な動画クリップを抽出するところにあります。たとえば、ユーザーが「特定の人物が何をしているシーン」を探した場合、RAGは関連するフレームを効率的に見つけ、生成AIがその場で応答する形で情報を提示することができます。

画像
マルチモーダルRAG の解説
(出典:DeepLearning.AI
Multimodal RAG: Chat with Videosから編集部作成)



 この技術は、金融機関にとって業務プロセスの効率化や監査の自動化に革新をもたらす可能性があります。たとえば、金融機関の事務処理において、動画RAGを利用してPCの操作や画面キャプチャを監視し、特定の業務の開始時間や終了時間を自動的に計測することができます。

 これにより、業務プロセスの可視化が進み、手動での記録が不要になります。操作手順やエラー検出も自動化され、プロセスの最適化が図られるでしょう。

 さらに、顧客対応の監査やトレーニング用途でも動画RAGは役立ちそうです。たとえばカスタマーサービスの応対内容を動画として記録し、その中から重要な瞬間(顧客のクレーム対応や規則に関する説明など)を自動的に抽出し、関連する法令や社内ルールに照らし合わせて評価することなどが考えられます。

 今後、動画RAGが進化することで、ビジネス現場でのさらなる自動化が進むことでしょう。

 たとえば、金融機関のリスク管理において、監視カメラ映像から異常な取引や不正行動の兆候をリアルタイムで検知するシステムが構築されるかもしれません。また、トレーニング動画から最適な手順やベストプラクティスを自動的に生成し、従業員の教育に活用するということも可能になります。

2024年は生成AIによる“AIエージェント元年”

 2024年は、“AIエージェント元年”ともいえる年です。

 これまでAIは限定的な自動化や壁打ちなどのアシスタントとしての役割を果たしてきましたが、AIエージェントは、単にタスクを自動化するだけではなく、複雑な業務フローを理解し、タスクの分割・優先順位付け・調整を行いながら自律的に意思決定を行います。

 企業内では、複数のエージェントが連携し、それぞれの専門分野に特化して複数の業務を処理することで、全体の業務プロセスを円滑に進めることが可能になることが期待されます。

 たとえば、金融機関において、融資審査のプロセスで、エージェントが顧客データを収集し、リスク分析を行い、さらに専門のエージェントが審査結果をレビューする、といった一連のプロセスをすべてAIエージェントが管理できるようになるでしょう。

 o1のように、生成AIの推論エンジンが強化されることで、人間の意思決定を支援するだけでなく、業務の進行を主導する役割を果たせる時代が来ることでしょう。エージェントは、「何をすべきか」を自ら判断し、その結果を人間に提示するだけでなく、必要に応じて作業の一部を人間に委託する形で「発注」することができるようになります。

 AIエージェントが業務を管理することで、銀行員は複雑な融資判断や顧客対応など、より高付加価値の業務に集中できるようになります。たとえば、顧客対応の自動化を行うエージェントが、顧客からの問い合わせを処理し、その対応履歴を基に問題を分類・解決する一方で、複雑なケースや新規顧客との対話には人間が介入するといった形での役割分担が考えられます。

 ただ、AIエージェントの普及にはいくつもまだ壁があるのも事実です。大きなものとしては、AIが何をもって「完了」と見なすか、どの程度のクオリティを求めるかといった基準をどう定め、どう運用するかという課題があります。

 特に、金融機関のような規制が厳しい環境では、AIの意思決定が透明であり、問題が生じたときの原因究明が可能であることが求められます。AIが自律的に業務を管理し、タスクを完了させるプロセスは、その評価基準や判断プロセスがはっきりと説明できるものでなければ、コンプライアンス上のリスクが生じます。

 また、タスク管理が完全にAIエージェントに任された場合、エラーや未確認の問題が発生する可能性があります。人間がそのエージェントの判断を監視し、誤りを修正する仕組みが求められます。これは、特に高リスクな業務では重要です。

評価する

いいね!でぜひ著者を応援してください

  • 11

いいね!でマイページに保存して見返すことができます。

共有する

  • 0

  • 8

  • 0

  • 1

  • 0

  • 2

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
関連タグ タグをフォローすると最新情報が表示されます

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます