- 会員限定
- 2025/03/27 掲載
アマゾンが仕掛ける「アレクサ革命」、その裏にある「秘密兵器」とは?

エージェント機能搭載した新アレクサが登場
音声アシスタントの代名詞として知られるアマゾンのアレクサが、10年の歴史で最大の進化を遂げようとしている。2025年2月、同社は生成AIを全面的に活用した次世代バージョン「Alexa+(アレクサプラス)」を発表した。従来のアレクサと比べ、会話の自然さや理解力が大幅に向上し、さらにユーザーに代わってさまざまなタスクを遂行できる「AIエージェント機能」を備えたことが特徴だ。
アマゾンのデバイス&サービス担当上級副社長であるパノス・パナイ氏は「これまでは技術的な制約により、アレクサの可能性が制限されていた」と述べる。しかし最新の生成AI技術により、ついにその制約から解放されたという。

実際の利用シーンでは、たとえばユーザーのお気に入り作家の新刊が出た際に自動的に通知したり、好きなアーティストが近くでライブを行う際にチケットの購入を提案したりできる。「オフィス近くのピザ店はどこ? 同僚は気に入るだろうか? 良さそうなら予約してほしい」といった複雑な指示にも対応可能とされる。
注目すべきは、アレクサがWebサイトやアプリを自律的に操作できる能力を備えた点だろう。たとえばオーブンの修理が必要な場合、アレクサが自動的にウェブを検索し、適切な業者を見つけ、認証を行い、修理の手配まで完了させることができる。この一連のプロセスにユーザーが介入する必要はない。
さらに、アレクサはユーザーの購入履歴、視聴した動画、配送先住所、支払い方法など、さまざまな情報を把握。家族のレシピ、重要な日付、食事の好み、アレルギー情報なども記憶できる。たとえば家族の夕食を計画する際、ユーザーがピザ好きで、娘がベジタリアン、パートナーがグルテンフリーといった情報を考慮したレシピやレストランを提案することも可能だという。
価格は月額19.99ドルだが、アマゾンプライム会員は無料で利用できる。米国では数週間後から順次提供を開始し、まずはEcho Show 8、10、15、21の所有者を優先的に展開する予定だ。
実は、生成AIを活用したアレクサの刷新は、当初の予想以上に困難を極めていたと言われる。2023年9月の発表時には、より自然な会話が可能で、その場でストーリーやレシピを作成できる新バージョンをプレビュー版として米国で提供する予定だったが、実現には至らなかった。
新アレクサの開発が長引いた理由
ファイナンシャル・タイムズは、アマゾンのAI総責任者であるロヒット・プラサド氏の話として、主な課題として応答速度の改善と「ハルシネーション(幻覚)」の抑制があったと報じている。ハルシネーションとは、生成AIが実在しない情報を作り出してしまう現象だ。アップルのAI機能やグーグルのAIオーバービューでも同様の問題が報告されており、AIアシスタントへの信頼性を損なう要因となっている。さらに複雑なのが、既存のアレクサインフラと新しいAIモデルの統合だ。新バージョンでは音声クエリの認識・翻訳、応答生成、不適切な応答やハルシネーションの検出などを複数のAIモデルで対応する。従来のシステムと新しいAIモデルを連携させるためのソフトウェア開発が、大きな障壁となっていたという。
コストの問題も深刻だ。複雑な大規模言語モデル(LLM)を大規模に運用するには多額の費用が必要となる。特にハルシネーションを避け、精度の高い回答を毎回生成するには、利用コストの高いモデルを選択せざるを得ない。かつて無料で利用できたアレクサに今回月額利用料が発生する大きな理由の1つとなっている。
これに対してアマゾンは、複数のAIモデルを組み合わせる「モデルミキシング」を採用。現在アマゾンの自社開発モデル「Nova」とAnthropicのモデルを使用しているが、今後はAmazon Bedrock上で利用可能な他のモデルも導入する予定という。各タスクに最適なモデルを自動的に振り分けることで、より効率的な処理ができるようになると期待される。 【次ページ】新アレクサの開発が長引いた理由
関連コンテンツ
関連コンテンツ
PR
PR
PR