0
会員になると、いいね!でマイページに保存できます。
ChatGPTの登場以降、ビジネスにおける活用が急激に進む生成AI。その中で現在特に注目されているのが「AIエージェント」だ。AIエージェントの仕組みを活用することで電話の応答やメール送信を行う「AI社員」の実現が可能になるため、人材不足を解消するカギになるのではと期待を集めている。「AI社員」とは具体的にどのような存在なのか。AIエージェントを提供するスタートアップの動向とともに解説する。
「AIエージェント」とは何か
2023年はテック大手がこぞって「生成AI」事業に参入し、生成AIへの過剰な期待を生み出す結果となった。2024年に入った現在、このハイプ状態はある程度落ち着き、現実路線での生成AIの可能性を模索する動きに
シフトしつつある。
そんな中、開発者らを含むAIコミュニティの間で注目を集めているのが、生成AIに複雑なタスクを指示できる「AIエージェント」という仕組みだ。
AIエージェントとは、複数のAIモデルを組み合わせ、単一のモデルでは困難な高度なタスクを自動で実行できるシステムのことである。企業の事務作業であれば、電話応対、スケジュール管理、データ入力など、これまで人間が行っていた一連の業務を自動化できる仕組みとなる。
2023年に設立されたばかりのシリコンバレーのAI企業
Newo.aiが提供するサービスはその1つだ。
同社は、大規模言語モデル駆動のAIエージェントと物理的ロボットを組み合わせ、事務処理から顧客対応まで幅広いオフィス業務をこなす、「AI社員」を構築するプラットフォームを提供している。
このAI社員は、人間の社員ができるほとんどのオフィス管理タスクをこなすことができる。具体的には、電話の発着信、テキストでのチャット、Eメールの送信、Zoomコールへの参加、メモの作成、さらにはオフィスへの訪問者の受け入れなどの対応が可能だという。
AI社員の構築にかかる時間は、最短で2時間ほど、長くても2日ほどだ。企業のニーズに応じて、レセプショニスト、営業担当者、テクニカルサポート、カスタマーサクセススペシャリスト、人事担当者など、さまざまな役割を与えることができる。
同社の共同創業者でCEOを務めるデイビッド・ヤン氏は、VentureBeatの
独占インタビューで「2023年以前は、AIエージェントテクノロジーは柔軟性、自律性ともに低く、企業で導入できるレベルにはなかった」と指摘している。
ローコード・ノーコードで構築も簡単
OpenAI Assistantsや
LangChain、
Sierraなど、AIエージェントを構築できるツール/サービスはNewo.ai以外にも存在する。
しかし、それらは特定のタスクに特化しているか、AIエージェントを作成するのに数カ月のコーディング期間が必要など、制限や導入障壁が存在する。
この点を踏まえ、Newo.aiが注力しているのがノーコード・ローコードによるAIエージェント構築の仕組みだ。
同社のプラットフォームには、「スキル」と呼ばれる業務機能の最小単位があらかじめ用意されており、ユーザーはそれらを組み合わせるだけで簡単にAI社員を作成できる。たとえば、電話対応、チャット、Eメール送信といった一連の業務を1つの「フロー」として定義し、AI社員に割り当てるといったことが可能だ。
また、Newo.aiではインテグレーションにも力を入れている。
APIを介して社内の各種システムとAI社員を連携させることができるほか、APIを提供していないサービスとの連携を可能にする「マジックインテグレーション」と呼ばれる機能も用意。これにより、AI社員はウェブサイト上でのスクロールやクリックという動作を実行しながら、予約の取得やキャンセル処理なども自動で行えるようになる。
こうした特徴により、Newo.aiでは他社よりも10倍高速でAI社員を構築できるという。ヤン氏は先ほど紹介したVentureBeatのインタビューで、「Newo.aiは、WordPressがウェブサイト構築のために実現したのと同じことを、AIエージェント構築のために行った」と説明し、同社のプラットフォームを「AIエージェントのためのWordPress」と表現している。
人件費は「半分以下」に?
Newo.aiのAIエージェントは、ウェブ上だけなく、物理的なロボットに組み込むことも可能だ。AIエージェントをロボットに組み込み、ロボット社員として雇用することで、特に人手不足が深刻化している中小企業の生産性を改善することが期待される。
Newo.aiのウェブサイトでは、レッドウッドシティにあるSoliVana Wellness Spaでの導入事例が
紹介されている。このスパでは、セラピストが受付業務を兼務していたが、ビジネス機会の損失につながっているとし、受付を専門とするロボット社員を雇用した。一般的にエントリーレベルの受付業務の場合、その人件費は5万ドルほど。しかしNewo.aiのロボット社員の場合、最上位モデルのロボットに最も複雑なAIエージェントを組み込んだとしても、年間コストは2万ドル以下に抑えられるという。
AI社員/ロボット社員が燃え尽きることなく、指示された業務を24時間365日継続できることを鑑みると、実質的なコストは2万ドルをはるかに下回りそうだ。ヤンCEOによると、最もベーシックなロボットの場合、コストは1万ドル以下となり、近い将来5,000ドル以下まで下がる見込みだという。
加えてNewo.aiはUI・UX向上にも注力しており、マネージャーが自然言語を使ってその場でAI社員への指示を更新できる機能の開発も進めている。この機能は、マネージャーの声紋を認識し、アクティベーションコードを確認した後、AI社員への指示を更新するもの。キーボードなしで指示を更新できる直感的な機能であり、ユーザーエクスペリエンスは大きく向上しそうだ。
元OpenAIの取締役会会長も参入
AIエージェントに関しては、前述したOpenAIの取締役会会長であるブレット・テイラー氏が立ち上げたAIエージェントスタートアップ、
Sierraも話題となっている。
セールスフォースの元共同CEOでもあるテイラー氏は、グーグルのVR部門の元責任者クレイ・ベイバー氏と共同で同社を設立。すでに、セコイアやBenchmarkを含む複数の投資家から1億1,000万ドルの初期資金を調達しており、Weight Watchers、SiriusXM、Sonos、OluKaiなどの有力企業を
初期顧客として獲得している。これらの企業は、Sierraのテクノロジーを使って毎月数十万件に上る顧客との会話を処理し、カスタマーエクスペリエンスチームの生産性向上に寄与しているとのことだ。
同社のAIプラットフォームでは、大規模言語モデルを活用して、企業がそれぞれのビジネス文脈に沿ったAIエージェントを構築できる。これらのAIエージェントは、会話中の専門用語、タイプミス、文脈を理解し、人間のような感情のこもった返答を行うことが可能という。
感情のこもったAIエージェントを構築できる点に加え、Sierraが主張するもう1つの強みがある。それは企業の社内システムと統合して、データにアクセスし、許可されればアクションを実行できる点だ。これによりAIエージェントは、顧客のサブスクリプションのアップグレード、注文管理システムにおける納期遅延管理まで、非常に多くのタスクを実行できるようになる。
AIエージェントは、2023年頃からさまざまな試みが実施されてきたが、いくつかの制約によって普及が拒まれてきた。
その1つは、生成AIの
応答スピードだ。ChatGPTのように、テキストでのやり取りを行う場合であれば、応答スピードが遅くても、ユーザーエクスペリエンスへの影響は限定的といえる。しかしこれが電話対応など、自然な会話スピードが求められるシーンでは致命的な欠陥となる。
たとえば、営業向けのAIエージェントを構築して営業電話をかけたとしても、自然な口調とスピードを保持できなければ、会話は成り立たない。これまでもいくつかの電話対応AIエージェントが登場したが、バックエンドで稼働する大規模言語モデルの応答スピードが十分ではなく、AIエージェントの応答も遅延することがほとんどだった。
しかし最近になり、Mixtralに見られるようにモデル自体が高速化していることに加え、AI推論に特化したチップが登場しており、大規模言語モデルの応答はかなり高速化してきている。Mixtralは、OpenAIのGPT-4 Turboに比べ
約8倍早くトークンを処理できる。また、Groqが開発した推論専用の
AIチップは、理論上ChatGPTを13倍高速化することが可能だ。
こうした進化が示唆するのは、電話対応や受付対応など自然な応答スピードが求められるシーンにおいても、AIエージェントがしっかりと対応できるようになるということだ。AIエージェントが普及するための技術的土台は整いつつある。Newo.aiやSierraのような新しいスタートアップに加え、OpenAIやグーグルなどもAIエージェント関連の取り組みを加速させており、AIエージェントをめぐる開発競争の激化が予想される。
評価する
いいね!でぜひ著者を応援してください
会員になると、いいね!でマイページに保存できます。
関連タグ