- Googleが動画生成AIモデル「Veo 2」をGemini Advancedユーザーに提供開始
- OpenAIのSoraに対抗する動きとして注目される
- 8秒間の720p解像度(16:9)動画生成が可能に
- クリエイティブ業界への影響懸念も浮上
Gemini Advancedで利用可能になるVeo 2
Googleが動画生成AIモデル「Veo 2」をGemini Advanced(同社のプレミアムAIプラン)の有料ユーザー向けに提供開始することを発表した。この拡張はGoogleがOpenAIの動画生成プラットフォーム「Sora」への回答を提供しようとする中、この分野の競争がより激しくなっている状況を反映している。2週間前には、有力な合成メディア企業の一つであるRunwayが第4世代の動画生成技術をリリースし、3億ドル(約450億円)以上の新規資金調達を実施している。
Veo 2の機能と制限
火曜日から、Gemini Advancedのサブスクライバーは、GoogleのGeminiアプリのモデルドロップダウンメニューからVeo 2を選択できるようになる。ユーザーは720p解像度、16:9アスペクト比の8秒間の動画クリップを作成し、Geminiの「共有」ボタンを通じてTikTokやYouTubeなどにアップロードすることが可能だ。Veo 2で生成された動画はMP4ファイルとしてダウンロードでき、GoogleのSynthID技術によるウォーターマークが入る。
同社によると、ユーザーが毎月作成できる動画数には制限があり、現時点ではGoogle Workspaceのビジネスプランと教育プランはサポートされていないという。
Whiskとの統合でさらなる拡張
GoogleはまたVeo 2を「Whisk」と統合している。WhiskはGoogle Labsの実験的機能で、ユーザーがGeminiで画像をプロンプトとして使用し、新しい画像を作成できるツールだ。新機能「Whisk Animate」では、生成した画像を8秒間のVeo 2生成動画に変換することが可能になる。(Google LabsはGoogleの初期段階のAI製品のプラットフォームで、月額20ドル(約3,000円)のGoogle One AIプレミアムサブスクリプションの背後にある。)
将来展望と業界への影響
現時点でのVeo 2の応用は比較的基本的に見えるかもしれないが、Google DeepMindのCEOであるDemis Hassabis(デミス・ハサビス)氏は最近、同社が最終的にGemini AIモデルとVeoを組み合わせて、Veoの物理的世界の理解を向上させる計画があると述べている。
一方で、多くのアーティストやクリエイターはVeo 2のような動画生成ツールがクリエイティブ産業全体を覆す恐れがあると警戒している。Animation Guild(ハリウッドのアニメーターと漫画家の組合)が委託した2024年の調査では、2026年までにAIによって10万人以上の米国を拠点とする映画、テレビ、アニメーション関連の職が影響を受けると推定している。
引用元:TechCrunch
Google’s Veo 2 video generating model comes to Gemini