• 会員限定
  • 2024/11/17 掲載

爆速生成AI「Llama 3.1 405B」をクラウド利用する、初心者向けステップガイド

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
14
会員になると、いいね!でマイページに保存できます。
メタがリリースした4050億パラメータの超大規模言語モデル「Llama 3.1 405B」は、オープンソースであり、個人のパソコンにインストールして利用することができる。しかし実際の運用には、高スペックハードウェアが必須となるため、誰もが簡単に利用できるわけではない。これに対して、SambaNovaがリリースした新クラウドサービスでは、このLlama 3.1 405BをAPI経由で利用することができる。最大の利点は、秒間100トークン以上のスピードだ。この爆速モデルを利用するためのステップを詳細に解説したい。
執筆:細谷 元  構成:ビジネス+IT編集部
photo
Llama 3.1 405Bのアウトプットスピード比較(1秒あたりの出力トークン数)
(出典:Artificial Analysis

高性能オープンモデルLLMを爆速で利用できるAPI

 メタがリリースしたLlama 3.1 405B(4050億パラメータ)は、オープンソースでありながらGPT-4などに並ぶ高い精度を有するモデルで、AIコミュニティでは注目の的となっている。

 しかし、実際に運用するには高スペックなハードウェア(GPUなど)が必須となるため、アプリケーションへの応用には高いハードルが待ち受ける。

 こうした中、AI企業SambaNovaが2024年9月に発表した「SambaNova Cloud」は、Llama 3.1 405Bを最速で利用できるプラットフォームとして大きな注目を集めている。

 このサービスは、同社独自のAIチップ「SN40L」を活用しており、Llama 3.1 405Bを、秒間最大132トークンという驚異的な速度で利用できるという。

 この速度は、OpenAI、アンソロピック、グーグルなどが提供するフラッグシップモデルのアウトプットスピードを上回る記録となる。また、他のクラウドサービスにおけるLlama 3.1 405Bのアウトプットスピードも大きく上回る。たとえば、Artificial Analysisの分析によると、マイクロソフトAzureでは秒間15トークン、AWSでは13トークンにとどまる。

 特筆すべきは、SambaNovaが405Bモデルをフル精度(16ビット)で実行できる点だろう。これにより、高い精度と速度を両立したAIアプリケーションの開発が可能になると期待されている。

 SambaNova Cloudは、無料のAPIアクセスを提供するフリーティア、開発者向けの高レート制限を備えたデベロッパーティア、そして本番ワークロードに対応するエンタープライズティアの3段構成で提供される。

 以下では、このSambaNova CloudのAPIを活用する方法をステップバイステップで解説していきたい。

 準備するのは、「Python3」、統合開発環境「VS Code」、そしてSambaNova CloudのAPIキーの3つ。

 以下の5ステップにより、SambaNova Cloud API利用を実行する。

  1. ステップ1:Python3のインストール
  2. ステップ2:VS Codeのインストール
  3. ステップ3:必須ライブラリのインストール、.envファイルの準備
  4. ステップ4:SambaNova CloudのAPIキーの取得
  5. ステップ5:Pythonスクリプトと実行

ステップ1:Python3とVS Codeのインストール

 まずはPythonのインストールだ。ただし、ここは以前も本連載で触れたほか、ネット上に多様なドキュメントがそろっているので割愛する。

ステップ2:VS Codeのインストールと仮想環境構築

 Pythonをインストールした後、VS CodeのサイトからVS Codeをダウンロードする。

※こちらもVS Codeをすでにインストール済みの場合はスキップしてほしい。

画像
Visual Studio Code

 VSCodeファイルがダウンロードできたら、パソコンにインストールする。

 インストール後、まずVSCodeアプリを立ち上げ、以下の画面を表示する。

画像
Visual Studio Code

 VS CodeのメニューにあるViewをクリックし、Command Paletteを選択。

画像
筆者スクリーンショット

 すると、VS Codeの検索窓に、「>」マークが表示されるので、そこで「Shell Command: Install 'code' command in PATH」を検索して実行する。

画像
Visual Studio Code

 このステップを踏むことで、ターミナルコマンドから、VS Codeを開くことが可能になる。

 次は、AIモデルをインストールするための「仮想環境」を構築する。

 仮想環境とは、Pythonプロジェクトごとに独立したPythonの実行環境を作るための仕組み。これにより、プロジェクトごとに異なるパッケージやライブラリのバージョンを使い分けることができ、システム全体のPython環境に影響を与えずに開発を進めることが可能となる。

仮想環境を構築するためのステップ:
  • ターミナルを開き、以下のコマンドでホームディレクトリにいること再確認。

    cd ~

    (cdとはchange directoryの略で、ディレクトリを移動するときに使うコマンド)

  • 今回はホームディレクトリ直下に「sambanova」フォルダを作成し、この中に仮想環境を構築する。まず、以下のコマンドで「sambanova」フォルダを作成。

    mkdir sambanova

    (mkdir とは、make directoryの略で、ディレクトリを作成するコマンド)

  • 次に、以下のコマンドで同フォルダに移動。

    cd sambanova

  • sambanovaフォルダ内で、以下のコマンドを入力し、仮想環境を作成する。

    python3 -m venv venv

    (これは「python3」の「-m venv」モジュールを使い仮想環境を構築、そのファイル名は「venv」とするという意味。2つ目のvenvは任意で、myvenvなどにしても問題ない。その場合は、python3 -m venv myvenvなどとなる)

  • 仮想環境を作成したら、以下のコマンドで仮想環境をアクティベートする。

    Mac:source venv/bin/activate
    Windows(コマンドプロンプト):venv\Scripts\activate
    Windows(パワーシェル):.\venv\Scripts\Activate.ps1

 以下の画像5行目のように、行の最初が(venv)となっていれば、現在仮想環境内にいるということになる。

画像
筆者スクリーンショット
【次ページ】ステップ3:必須ライブラリのインストール
関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます