0
会員になると、いいね!でマイページに保存できます。
グーグルが提供する生成AI「Gemini」の有料版「Gemini Advanced」がリリースされた。無料で利用できる「Gemini」と「Gemini Advanced」の精度には、どの程度の差があるのだろうか。スピーチ原稿や議事録、画像認識などさまざまな用途で比較してみた。さらに、Gemini Advancedと競合サービスであるChatGPTおよびClaude 3の有料版とも出力結果も比べてみると、各モデルの特徴が見えてきた。課金するなら、どの生成AIサービスを選べば良いのだろうか?
無料版Geminiは「テンプレそのまま」
まずは、無料の「Gemini」と有料の「Gemini Advanced」でさまざまなプロンプトを入力し、結果を比較した。両者の精度の違いについて、見ていこう。
最初に、ゼロから新たな文章を生成する用途として、「入社式を想定した2分程度のスピーチ原稿」を作成してみた。無料版Geminiで出力されたものは、よくあるテンプレートをそのまま使ったという印象である。悪くはないが、この程度であれば生成AIを使うまでもなく自力で作れそうだ。
一方のGemini Advancedは、冒頭で自社の特徴を紹介したり、「大切なこと」に具体的な説明が盛り込まれたりと、より肉付けされた内容となった。ただし、全体的な完成度はもう一歩という印象もある。
たとえば、この原稿では「はなむけの言葉として、3つの大切なことを~」と出力されているが、「はなむけの言葉として」はあくまでもプロンプトに指定した背景情報なので、スピーチ内でわざわざいう必要はないように思う。
Geminiはプロンプトに対して忠実な出力が行われる傾向があるが、その忠実さが裏目に出ている印象だ。
このほかに、「契約につなげる目的で商談のお礼メールを書く」「経緯を説明してお詫びをする」といったユースケースでも、Gemini Advancedのほうが内容が充実し、文体も丁寧な印象になる。
一方で、「顧客に送る展示会の案内状」「飲食店の臨時休業の告知」といった定型的な内容の短い文章を作成する場合は無料版GeminiとGemini Advancedであまり大きな差は見られなかった。
議事録作成でわかった無料・有料版との差
会議の録音をテキスト化したものから議事録を作成するケースのように、既存のデータに対する編集や要約を行う用途でも、両者の出力には差が生じた。ここでは、会議の文字起こしデータを想定したサンプルテキストを使用して議事録を作成している。
無料版Geminiでは、議事が「セミナーテーマ」「詳細な企画内容」などの見出しに分けられ、それぞれの内容が箇条書きで記載されたものが出力された。これでも十分使えそうだが、Gemini Advancedの出力では見出しが階層化され、よりわかりやすく整理されている。
たとえば、この会議では「セミナーの会場と会期」について検討されている。無料版Geminiの場合、これらの項目が「詳細な企画内容」としてまとめられているのに対して、Gemini Advancedは「セミナー詳細企画」の見出しの下層に「会場」や「会期」という項目が設けられ、それぞれどのような検討が行われたのかが記載されている。
さらに「今後のスケジュール」の項目にも会場と日程を検討する旨が書かれているなど丁寧な印象だ。
なお、今回使用したサンプルの文字起こしデータは3000字ほどの短いものだが、1万字を超える長いテキストを使用した場合も、Gemini Advancedのほうが詳しく丁寧な出力が行われる傾向が見られた。概要の把握程度なら無料版Geminiでも十分だが、全体をきちんと把握することが目的であれば、Gemini Advancedに優位性があるといえそうだ。
Geminiの画像認識は“旧来の検索”の方が強い?
無料版Gemini、Gemini Advancedともに、写真をアップロードしてその内容についての質問に回答できる。ただし、この機能については、現時点ではまだ発展途上という印象だ。
たとえば、テーブルに並んだ料理の写真に対して「この写真に写っているものを教えてください」と質問した場合、透明な液体の入ったグラスの中身を「赤ワイン」と認識したり、存在しない「赤いチェック柄のテーブルクロス」が敷かれていると答えたりするなど、無料版Gemini、Gemini Advancedともに誤りを含んだ回答が出力される。
このほかにもさまざまな写真を使い、被写体についての説明を求めてみたが、有料のGemini Advancedであっても正しく答えられないケースが多く見られた。
興味深いのは、Geminiでは正確な情報を得られない画像も、Googleレンズを使った検索では正しい答えが見つかるケースがあることだ。
たとえば、モウコノウマという少し珍しい品種の馬の写真をアップロードし、「この馬の品種は何ですか?」と質問した場合、無料版Gemini、Gemini Advancedともに「ポニー」との回答が返ってくる。たしかにモウコノウマはポニーに分類されるが、これはサイズによる分類で品種ではない。
一方で、スマホのGoogleアプリからGoogleレンズを使った場合は、すぐに正しい品種名や写真、この品種について説明したWikipediaや動物園の公式サイトのリンクが見つかる。ユーザーが求めている情報は明らかに後者だろう。
なお現時点では、無料版Gemini、Gemini Advancedともにアップロードできるのは画像に限定され、PDFなどのファイルを扱うことはできない。競合サービスのChatGPTやClaudeは画像以外のファイルもアップロードできるので、こちらもやや物足りなさを感じる。今後のアップデートが待たれる部分だ。
【次ページ】何を選ぶ?「Gemini」「ChatGPT」「Claude 3」の有料版を比較
関連タグ