0
会員になると、いいね!でマイページに保存できます。
日本でもChatGPTなどジェネレーティブAIが話題を集めているが、1月に開催された世界最大のコンシューマテクノロジー見本市CESでは、ここ数年にわたってAIが注目トピックの1つとなっており、今年も「AIの進化」に関心が注がれた。本記事ではCESに出展していたAI分野の注目株8社をまとめて紹介したい。
82言語をリアルタイム翻訳
CESでこの数年注目トピックの1つとなっている「人工知能(AI)」。2023年のCESでもAIの進化を垣間見ることができる。
今年のCESでは、AI活用により、コンシューマプロダクトがより直感的に利用できるようになっている様子が観察される。
注目株としてまず挙げられるのは、米ユタを拠点とするAI企業OneMetaが開発したリアルタイム多言語翻訳アプリ「
Verbum」だ。
Verbumは、ウェブベースのAI翻訳アプリで、現行のVerbum1.0では82言語・40方言に対応、同時に50人の会話をリアルタイムに翻訳することができる。翻訳した情報は、キャプション(字幕)とAI生成の音声として出力することが可能だ。ビデオコール/オンライン会議に対応するほか、通信環境がない場所でもスマホで利用できる
という。
複数のメディアがCES2023の現地でVerbumのデモを体験し、レビューを行っているが、若干のラグがあるものの、翻訳(英語とスペイン語)の精度はかなり高いと
評価している。
Verbumは主にオンライン会議での利用を想定しデザインされたアプリだが、メタバースでも重要な役割を担う可能性を
秘めている。
メタバースは理論上、地理的な制約を取り払い地球上すべての人が同じ仮想空間を共有することを可能にするが、言語の壁という課題が残されている。多数のユーザーの発言を同時に文字化・音声化できるVerbumがソリューションの有力候補になるのは間違いないだろう。
音声生成のAIテクノロジー
Verbumと並びAIの音声生成分野では、米サンノゼを拠点とする音声AI企業
SpeechmorphingのAIツールにも注目が集まった。
同社が開発しているのは、話者の声を他者に似せるだけなく、テキストインプットから任意の声による音声を生成できる音声AIテクノロジーだ。
音声によるブランディング、多数の国・文化に向けたボイスメッセージのパーソナライゼーション、特定の音声による顧客エンゲージメントの改善などでの活用が見込まれる。
直感的な操作で360度対応のパノラマ風景を生成
AIによる生成技術は、音声だけなく2D/3D映像領域でも進化を遂げている。
CES2020でNVIDIAが公開した「NVIDIA Canvas」。簡単なストロークからAIがリアルな自然風景を生成するツールで、当時多くの注目を集めた。
CES2023では、このNVIDIA Canvasの360度対応版が
披露された。仕組みはNVIDIA Canvasと同じで、簡単なストロークから、AIが360度のパノラマ風景を生成する。
コンピュータグラフィックス(CG)やゲーム開発において、360度のパノラマ画像は、背景として用いられている。背景に使用される360度パノラマ画像は通常360度カメラで撮影されたものだが、近い将来Canvas 360で生成されたパノラマ画像がさまざまなシーンで使われるようになることも考えられる。
【次ページ】3Dモデリングを大きく変えるスキャンアプリ
■お詫びと訂正[2023/02/07 11:07修正]
一部内容に誤りがありました。本文は修正済みです。ご迷惑をおかけした読者ならびに関係者にお詫び申し上げます。
誤:Nvidia Campas
正:NVIDIA Canvas
関連タグ