会員限定
2024/05/17 掲載

Samba-1とは何かをわかりやすく解説、1兆パラメータの大規模言語モデルのスゴさ

ありがとうございます！
いいね！した記事一覧をみる

会員になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

これまでOpenAIのGPT-3.5やGPT-4が火付け役になって進んできた大規模言語モデル競争。SambaNova Systemsが発表した1兆パラメータの大規模言語モデル（LLM）「Samba-1」も注目されるモデルの1つだ。GPT-4より少ない計算リソースで動作しつつ、同等以上の能力を持つというSamba-1とは一体どんなモデルなのか。また、Samba-1を生み出したSambaNovaとはどのような企業なのか。GPT-4と比較しつつ、わかりやすく解説する。

執筆：細谷元

SambaNovaが発表した大規模言語モデルは、GPT-4と比べどんな能力を持つのだろうか

（Photo：T. Schneider / Shutterstock.com、Hamara / Shutterstock.com）

Samba-1の特徴とは

生成AIで1分にまとめた動画

　Samba-1とは、SambaNova Systemsによって開発された、企業向けの1兆パラメータ規模の大型言語モデルである。

　同モデルは、OpenAIが提供するGPT-4のような単一の巨大モデルではなく、50以上のAIモデルを組み合わせた「Composition of Experts」アーキテクチャを採用しているのが特徴だ。個々のモデルが独立して機能しつつ、状況に応じて柔軟に連携することで、全体として高いパフォーマンスを発揮することが可能になるという。

　Composition of Expertsアーキテクチャでは、各エキスパートモデルがそれぞれ独自のデータセットで学習されるため、データのセキュリティとプライバシーを保持しつつ推論を行うことが可能だ。複数のモデルを組み合わせるアプローチは、フランスのAIスタートアップMistralが最近リリースしたMixtralモデルでも採用されている。

　一方、このアプローチは「Mixture of Experts」と呼ばれるもので、SambaNovaいわく、同社の「Composition of Experts」とは異なる。「Mixture of Experts」アプローチでは、1つのエキスパートモデルが複数のデータセットで学習されるため、データ漏えいのリスクが高まるというのだ。

　Samba-1を構成するエキスパートモデルには、LLaMA 2、Mistral、DeepSeek Coder、Falcon、DePlot、CLIP、Llavaなど、SambaNovaと他社の優れたオープンソースモデルが含まれている。SambaNovaは、最適なモデルを選定し最適化した上で、1兆パラメータ規模のモデルに統合した。

編集部おすすめ記事

【Copilot最新機能】Word・Excel・PowerPointの日常業務はこう変わる、Pythonも超簡単

GPT-4とどちらが優れている？

　そんなSamba-1は、GPT-4に機能面でどこまで近づいているのだろうか。

　SambaNovaは、Samba-1の性能を評価するために「Enterprise Grade AI（EGAI）」と呼ばれる独自のベンチマークテストを実施している。

　EGAIベンチマークは、オープンソースコミュニティで広く採用されている一連のベンチマークテストのコレクションで、特に企業のユースケースに関するタスクでのパフォーマンスを評価するものとなっている。

　このEGAIベンチマークの結果を見ると、Samba-1は情報抽出、APIを用いた情報検索、APIドキュメントの理解、数学的推論、コンテンツ評価、テキストからのSQL変換、プログラミング、テキスト編集など、幅広いタスクにおいて、GPT-3.5やGPT-4と同等かそれ以上の性能を示している。

GPT-4などと比較したSamba-1のパフォーマンス（対GPT-3.5、GPT-4）

（出典：SambaNova）

　特にGPT-4に対しSamba-1の強みが示されたのが、テキストからのSQL変換タスクだ。Samba-1内のエキスパートモデル「SambaCoder-nsql-llama-2-70b」はSQLクエリの生成に特化したモデルで、Spiderベンチマークで78.1％の精度を達成。GPT-4の76.2％を上回る結果となった。

　このSpiderベンチマークでは、たとえば、「このデータベースにおける収入が最も高い従業員は誰ですか？」という自然言語のクエリに対して、“SELECT name FROM employees ORDER BY income DESC LIMIT 1;”というSQLクエリに変換するなどのタスクが与えられる。これは、Samba-1がエキスパートモデルの組み合わせによって非常に高い専門性を発揮できることを示す好例と言えるだろう。【次ページ】GPT-4を30％上回った「強み」とは

Samba-1とは何かをわかりやすく解説、1兆パラメータの大規模言語モデルのスゴさ

Samba-1の特徴とは

GPT-4とどちらが優れている？

検証：テクノロジーが架ける2027年への橋──新時代のシステムはAI×ハイブリッドクラウドが鍵

【図解】生成AIのバリューチェーン、「DeepSeekショック」余波続く…勝者と敗者を一覧

なぜ足利銀行は「生成AIの定着」に成功した？「3ステップ」の驚きの効果とは

関連コンテンツ

半数以上が大苦戦…企業AI活用の「データ管理の大問題」、ガートナー流の解決メソッド

「AI研究40年」の研究者が解説、思考力が落ちる…？「生成AIと人間」の最適な距離感

あまりに凄い「ChatGPT活用の勉強法」、教科書も塾も不要になりそうな「ある機能」

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成までビジネスで使える生成AIを2時間で習得～

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成までビジネスで使える生成AIを2時間で習得～

【実演】DeepSeekファインチューニング＆RAG！GPUクラウド活用ウェビナー

【実演】DeepSeekファインチューニング＆RAG！GPUクラウド活用ウェビナー

生成DX実践講座～生成AIのビジネス活用パターン完全攻略の３時間～

生成DX実践講座～生成AIのビジネス活用パターン完全攻略の３時間～

人気のタグ

Samba-1とは何かをわかりやすく解説、1兆パラメータの大規模言語モデルのスゴさ

Samba-1の特徴とは

GPT-4とどちらが優れている？

検証：テクノロジーが架ける2027年への橋──新時代のシステムはAI×ハイブリッドクラウドが鍵

【図解】生成AIのバリューチェーン、「DeepSeekショック」余波続く…勝者と敗者を一覧

なぜ足利銀行は「生成AIの定着」に成功した？「3ステップ」の驚きの効果とは

関連コンテンツ

半数以上が大苦戦…企業AI活用の「データ管理の大問題」、ガートナー流の解決メソッド

「AI研究40年」の研究者が解説、思考力が落ちる…？「生成AIと人間」の最適な距離感

あまりに凄い「ChatGPT活用の勉強法」、教科書も塾も不要になりそうな「ある機能」

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成まで ビジネスで使える生成AIを2時間で習得～

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成まで ビジネスで使える生成AIを2時間で習得～

【実演】DeepSeekファインチューニング＆RAG！GPUクラウド活用ウェビナー

【実演】DeepSeekファインチューニング＆RAG！GPUクラウド活用ウェビナー

生成DX実践講座～生成AIのビジネス活用パターン完全攻略の３時間～

生成DX実践講座～生成AIのビジネス活用パターン完全攻略の３時間～

人気のタグ

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成までビジネスで使える生成AIを2時間で習得～

生成AI基礎講座～生成AIの基礎知識から業務アプリ生成までビジネスで使える生成AIを2時間で習得～