- 会員限定
- 2025/04/10 掲載
【図解】生成AIのバリューチェーン、「DeepSeekショック」余波続く…勝者と敗者を一覧

DeepSeek-R1が生成AI市場にもたらした影響
DeepSeek-R1が株式市場を揺るがしました。2025年1月23日、中国を拠点とするAIスタートアップ企業のDeepSeekが、オープンソースの推論型生成AIモデルR1を発表しました。このニュースは瞬く間に広がり、2025年1月27日の株式市場の取引開始までに、AI重視の大手テクノロジー企業の時価総額は大幅に下がりました。1月24日取引終了時から2月3日取引終了時までの時価総額の動き | ||
企業名 | 企業概要 | 時価総額変動 |
エヌビディア | データセンター向けGPUで最もよく知られる米半導体メーカー | 18%下落 |
マイクロソフト | Azureクラウドサービスを展開、クラウドAI分野でトップを走るハイパースケーラー | 7.5%下落 |
ブロードコム | ネットワーキング、ブロードバンド、カスタムASICを専門とする半導体企業 | 11%下落 |
シーメンスエナジー | データセンター事業者にエネルギーソリューションを提供するドイツのエネルギー技術ベンダー | 17.8%下落 |
市場参加者、特に投資家は、DeepSeekが発表したR1モデルが最先端のAIモデルと同等であり、おそらくわずか数千台のGPUのみでトレーニングされ、さらにオープンソースであるという点に反応しました。しかし、最初の株価急落から時間が経ち、その後の報告や分析により、当初の過熱した評価に対する検証が進んでいます。
DeepSeek-R1の特徴を整理

1. DeepSeek-R1の性能は、最先端の推論モデルと同等
最大のDeepSeek-R1モデル(6850億のパラメータ)のパフォーマンスは、米国の大手基盤モデルプロバイダーによる最先端のモデルと同等、またはそれ以上だと考えられています。実際にベンチマークでは、DeepSeek-R1は、OpenAIのo1やAnthropicのClaude 3.5 Sonnetなど、よりよく知られている主要なモデルと同等以上の性能を示しました。
2. DeepSeekは、当初報じられていたほどではないにしても、大幅に低いコストでトレーニングされている
初期報道ではトレーニング費用が550万米ドル以上とされていましたが、モデル全体の開発にかかった費用については、リリース後も議論が続いています。半導体関連の調査・コンサルティング企業セミアナリシスによると、この550万米ドルという数字はコストの一部に過ぎず、ハードウェア費用や研究開発チームの給与、その他の費用が含まれていないとのことです。
3. DeepSeekのAPI利用料は、OpenAIと比べて90%以上安価
モデル開発にかかった実際のコストはさておき、DeepSeekはAPI利用料をはるかに安く設定しています。具体的には、DeepSeek-R1の入力トークンと出力トークンは、それぞれ100万単位で0.55米ドルと2.19米ドルです。一方、OpenAIのo1モデルでは、それぞれ100万単位で15米ドルと60米ドルです。
4. DeepSeek-R1は革新的なモデル
DeepSeekが発表した関連の科学論文では、V3をベースにR1を開発する方法論が示されています。その内容は主に、MoEアーキテクチャー、強化学習、そして非常に独創的なハードウェア最適化技術の活用です。これにより、トレーニングと推論に必要なリソースをより少なくしたモデルを作成し、前述したAPIコストの低価格化を実現しました。
5. DeepSeekは多くの競合他社よりもオープン
DeepSeek-R1は、Hugging FaceやGitHubなどのプラットフォーム上で、無料で利用できます。ただし、重み付けやトレーニング手法に関する論文は公開されているものの、オリジナルのトレーニングコードとデータは公開されておらず、AI熟練者が同じようなモデルを構築できるようにはなっていません。これは、オープンソースイニシアティブ(OSI)が定義するオープンソースAIシステムの基準に照らすと、完全なオープンソースとは言えない状況です。
つまり、DeepSeekは他の生成AI企業よりもオープンなほうですが、OSI基準を考慮すると、R1はあくまでオープンウェイトに分類されます。それでも、このリリースはオープンソースコミュニティーの関心を呼びました。Hugging FaceはGitHub上で「Open-R1イニシアティブ」を立ち上げ、非公開要素である「R1パイプラインの欠けている部分」を構築することで、モデルの実質的な完全オープンソース化を目指しています。これにより、誰もがR1モデルを再現し、その上で独自の開発ができるようになるかもしれません。
6. DeepSeekはR1のメジャーリリースと同時に、強力な小型モデルも公開
DeepSeekは、6800億以上のパラメータを持つ主要な大型モデルだけでなく、(本稿執筆時点で)DeepSeek-R1の6つの蒸留モデル(大型モデルを教師として、その知識を転送した小型の生徒モデル)もリリースしました。
蒸留モデルのパラメータ数は、70Bから15Bの範囲にあり、後者は多くのコンシューマー向けハードウェアで動作可能です。2025年2月3日時点で、これらのモデルはHugging Faceだけで100万回以上ダウンロードされました。
7. DeepSeek-R1は、OpenAIのデータを使ってトレーニングされた疑いがある
2025年1月29日、「DeepSeekがモデルのトレーニングにOpenAIのAPIを使用した可能性(OpenAIの利用規約違反)を、マイクロソフトが調査している」と報じられました。一方で、同時にマイクロソフトはR1をAzure AI Foundryに追加するという動きも見せています。 【次ページ】生成AIのバリューチェーンを図解:誰が「勝者」で誰が「敗者」か
関連コンテンツ
関連コンテンツ
PR
PR
PR