- 会員限定
- 2025/02/14 掲載
Amazon Novaとは? アマゾン独自の大規模基盤モデルのパフォーマンスを確認する
![photo](https://www.sbbit.jp/article/image/157949/bit202502101529308782.jpg)
Amazon Novaとは?その実力とは
アンソロピックに巨額の資金を投じてきたアマゾンが、ついに独自のAIモデルを開発し、リリースに至った。アンディ・ジャシーCEOは2024年末に行われた年次開発者会議「AWS re:Invent」において、テキスト、画像、動画の生成が可能なAIモデルファミリー「Nova」を発表。これまでAI開発に関しては、同社はBedrockなど開発者向けツールやプラットフォームの構築に注力してきた。今回Novaファミリーをリリースしたことで、OpenAI、グーグル、アンソロピックなどと直接競合することになる。Novaで用意されているモデルは複数あり、低遅延応答に特化した「Nova Micro」は、テキストのみを扱うモデルながら、1秒間に200トークンという高速な生成を実現。言語理解、翻訳、推論、コード補完、ブレインストーミング、数学の問題解決などにおいて優れたパフォーマンスを発揮する。
マルチモーダルモデルとしては、「Nova Lite」と「Nova Pro」の2つを提供。Nova Liteは、画像、動画、テキストの高速処理を実現しつつ、低コストを実現したモデルだ。一方のNova Proは、精度、速度、コストのバランスを追求したモデルで、動画要約、Q&A、数学的推論、ソフトウェア開発など、幅広いタスクをこなす。
さらに、クリエイティブコンテンツの生成に特化した2つのモデルも用意されている。画像生成モデルの「Nova Canvas」は、テキストまたは画像をプロンプトとして、さまざまな画像を生成する。また、テキスト入力による画像編集や、色彩とレイアウトの調整機能も備えている。動画生成モデルの「Nova Reel」は、パン、ズーム、360度回転などの高度なカメラコントロールをサポートし、6秒の動画を生成できる。
これらのモデルは、アマゾンのフルマネージドサービス「Bedrock」のみで提供されるという。Bedrockは単一のAPIを通じてAIモデルへのアクセスを簡素化するサービスで、実験、評価、デプロイメントが可能だ。また、ファインチューニングとディスティレーションのオプションも用意されており、ユーザー固有のニーズに応じてモデルを調整することも可能だ。
今後のロードマップとしては、同社は2025年に3つのモデルを追加すると言われている。まず、2025年第1四半期には、Nova Proの上位モデルとなるNova Premierがリリースされる。おそらく、OpenAIのo1モデルのようなエージェントモデルで、高度な推論能力を持つモデルと推測される。
このほか、人間らしい音声対話を実現する音声対音声モデル「Amazon Nova Speech-to-Speech」、テキスト、画像、音声、動画を含むなどのモダリティ間の変換を可能にする「Amazon Nova Any-to-Any」もリリースされる予定だ。
主要モデルとのベンチマーク比較で見えてきたNovaの実力
アマゾンは、Novaファミリーのリリースにあたり、各モデルの広範なベンチマーク評価を実施した。特筆すべきは、上位モデルNova ProがOpenAIやアンソロピックなどの主要モデルに対して肩を並べる能力を示した点だろう。具体的な数値を見ていきたい。まず言語理解の基本的な能力を測るMMLUでは、Nova Proは85.9%を記録。GPT-4oの88.7%、Claude 3.5 Sonnet V2(2024年10月版)の89.3%には僅かに及ばないものの、Gemini 1.5 Proの85.9%と同等の成績を収めた。
![画像](https://www.sbbit.jp/article/image/157949/l_bit202502101533352118.jpg)
一方、数学的能力を測るGSM8Kテストでは、Nova Proは94.8%というスコアを達成。これはGPT-4oの92.6%、Gemini 1.5 Proの90.8%を上回る成績だ。より高度な数学問題を解くMATHテストでも76.6%と、GPT-4oと同等のパフォーマンスを見せている。
Nova Proは、Pythonコード生成タスクでも89.0%という高いスコアを記録。GPT-4oの90.2%に迫る成績を残し、Gemini 1.5 Proの87.8%を上回った。マルチステップ推論を評価するBig Bench Hardでは86.9%を達成。GPT-4oの83.0%を上回り、Gemini 1.5 Proの89.2%に肉薄する結果を示した。
中位モデルのNova Liteも、同クラスのモデルと比較して優位性を示す。言語理解のMMLUでは80.5%を記録。これは、Claude 3.5 Haikuの80.3%に並ぶ数字で、GPT-4o Miniの82.0%に肉薄するものとなる。数学分野のGSM8Kでは94.5%という高スコアを達成、Claude 3.5 Haikuの93.8%、GPT-4o Miniの86.4%を上回った。
![画像](https://www.sbbit.jp/article/image/157949/l_bit202502101534436598.jpg)
アマゾンの主張によれば、Nova Proは20のベンチマークテストのうち17のテストでGPT-4oと同等以上の性能を示し、21のベンチマークテストのうち16のテストでGemini 1.5 Proを上回る結果を残したという。特に指示追従タスクにおいて高い評価を獲得しており、Comprehensive RAG Benchmarkや、Berkeley Function Calling Leaderboardでその能力の高さを示したという。
これらのベンチマーク結果は、Nova ProとNova Liteが、言語理解、数学的推論、コード生成、マルチステップ推論など、幅広い分野で競争力を持つことを示唆するもの。特にNova Proは、GPT-4o、Claude 3.5 Sonnet V2、Gemini 1.5 Proといったトップモデルと互角以上の性能を発揮しており、アマゾンの技術力の高さを印象付ける存在となっている。 【次ページ】Novaの処理速度は? Artificial Analysisなどの評価
関連コンテンツ
関連コンテンツ
PR
PR
PR