- 会員限定
- 2024/10/07 掲載
エッジAI半導体に注目集まるワケ、日本発のEdgeCortixなどスタートアップも存在感
生成AIモデルの小型化とエッジAI需要
モデルの効率化と小型化の顕著な例として、グーグルのGemma 2 2Bが挙げられる。2024年7月末にリリースされたこの小型言語モデルは、わずか20億パラメータという非常に小さなモデルでありながら、GPT-3.5を上回るパフォーマンスを示した。
AI研究グループLMSYSの独立評価において、Gemma 2 2Bは1127点を獲得し、GPT-3.5-Turbo-0613(1117点)やMixtral-8x7B(1114点)を上回る結果となったのだ。
エッジAIの可能性を示すもう1つの事例として、Figure社の「Figure 02」の登場も見逃せない。Figure 02はOpenAIの大規模言語モデル(LLM)と人型ロボットの統合を目指しており、人間との音声対話も可能だ。
6つのオンボードRGBカメラと独自の視覚言語モデルを搭載し、周囲の状況を分析して自律的に移動できる。さらに、10本の指と16の自由度を持つ人間の手に近い構造を持ち、最大25kgの荷物の運搬が可能とされる。
SlashDataによると、2018年時点では、エンタープライズで生成されるデータのうち、エッジ環境で生成されたものはわずか10%に過ぎず、その大半がデータセンターやクラウドで発生していた。
しかし2025年には、75%のデータが工場、病院、リテールショップなどのエッジ環境で生成され、その大半はその場で記録/分析されると予想されている。また、こちらはやや古いがガートナーも50%以上のエンタープライズデータがエッジ環境で生成/処理されるとの予測を展開している。
エッジ環境でのデータ急増は、必然的にエッジAIの需要につながる。SkyQuestの予測によれば、エッジAI市場は2022年の156億ドルから2031年には1,859億ドルに成長する見込みだ。
エッジAI向け半導体の進化、主要プレイヤーの1つHailoの動向
エッジAIのハードウェア領域の競争は激化している。NVIDIA(詳細は後述)、インテル、AMD、クアルコム、グーグル、アップルなどの大手半導体メーカーに加えて、スタートアップも目覚ましい動きを見せている。特に注目されるのがイスラエル発のHailoだ。TechCrunchによると、AI半導体スタートアップの資金調達環境は厳しさを増している。2023年1月から9月までの米国半導体スタートアップの資金調達額は8億8,100万ドルで、2022年同期の17億9,000万ドルから大幅に減少した。
このような厳しい環境下で、Hailoは2024年3~4月のシリーズCラウンドで1億2,000万ドルの資金調達に成功した。
Hailoは2017年に設立されたエッジデバイス向けのAI半導体開発スタートアップ。同社の半導体は、一般的なプロセッサと比べて低メモリ、低消費電力でAIタスクの実行が可能で、特に自動車、スマートカメラ、ロボティクスなどオフラインかつバッテリー駆動の環境に適した設計となっている。
Hailoのミッションは、データセンター以外の場所で、高性能AIを利用可能にすること。同社のプロセッサはこれまで、主に物体検出やセマンティックセグメンテーションなど、コンピュータービジョンモデルを駆動するために活用されてきたが、最近ではエッジデバイスでのLLM利用を目的とした活用も増えているという。
エッジデバイスでの生成AI利用を可能にしているのが、同社の最新プロダクト「Hailo-10H M.2 Generative AI Acceleration Module」だ。この半導体は、消費電力を3.5~5ワットほどに抑えつつ、40テラ演算/秒(TOPS)の処理ができるモデル。Llama2 7B(70億パラメータ)であれば、1秒あたり10トークンでテキスト生成ができ、Stable Diffusion 2.1であれば5秒以下でテキストから画像を生成できるという。
従来のAIモデルはクラウドベースのインフラストラクチャに依存しており、レイテンシーの問題などの課題に悩まされているのが現状。Hailoは、クラウドから独立して動作するソリューションを提供することで、これらの課題に対処する構えだ。 【次ページ】海外メディアも注目する日本発のエッジAI半導体
関連コンテンツ
PR
PR
PR