- GoogleのDeepMind CEOであるDemis Hassabis氏がVeo 3のゲーム活用可能性を示唆
- Veo 3は現在パブリックプレビュー段階で、映像と音声を同時生成する機能を搭載
- Googleは既にGenie 2でプレイアブルワールド生成技術を展開済み
- Microsoft、Runway、OpenAI Soraなど競合他社との競争激化が予想される
DeepMind CEO、Veo 3のゲーム活用をほのめかす発言
GoogleのAI研究機関DeepMindのCEOであるDemis Hassabis(デミス・ハサビス)氏は火曜日の夜、同社の最新動画生成モデルVeo 3が潜在的にビデオゲームに使用される可能性があることを示唆したようだ。
Xでの投稿で「Googleよ、私のVeo 3動画でビデオゲームをプレイさせてくれ」と懇願し、「プレイアブルワールドモデルはいつ?」と質問したユーザーに対して、Hassabis氏は「それは何かになるのではないか」と応答した。水曜日の朝には、GoogleのAI StudioとGemini APIのリード製品担当であるLogan Kilpatrick(ローガン・キルパトリック)氏が「🤐🤐🤐🤐」という返信で加わった。
Google幹部からのこれらの投稿は遊び心のある示唆に過ぎず、Googleの広報担当者は現時点で共有できることはないと述べた。しかし、プレイアブルワールドモデルの構築は、この技術大手にとって可能性の範囲外ではない。
now wouldn’t that be something… https://t.co/WBeCMQye91
— Demis Hassabis (@demishassabis) July 2, 2025
ワールドモデルと動画生成モデルの違いとGoogleの戦略
ワールドモデルは動画生成モデルとは異なる。前者は実世界環境のダイナミクスをシミュレートし、エージェントが自らの行動に対して世界がどのように進化するかを予測できるようにする。動画生成モデルはリアルな動画シーケンスを合成する。
Googleは、マルチモーダル基盤モデルであるGemini 2.5 Proを、人間の脳の側面をシミュレートするワールドモデルに変える計画を持っている。12月、DeepMindは「無限の」多様性を持つプレイアブルワールドを生成できるモデルGenie 2を発表した。翌月には、Googleが現実世界をシミュレートできるAIモデルに取り組む新チームを結成していることが報告された。
Fei-Fei Li率いるWorld Labsなど競合の動向
他社もワールドモデルの構築に取り組んでいる。最も注目すべきは、AI分野の先駆者であるFei-Fei Li(フェイフェイ・リー)氏だ。Li氏は昨年、World Labsというスタートアップでステルス状態から脱出し、単一の画像からビデオゲームのような3Dシーンを生成する独自のAIシステムを構築した。
現在パブリックプレビュー段階にあるVeo 3は、動画だけでなく、クリップに合わせた音声(スピーチからサウンドトラックまで)も作成できる。Veo 3は実世界の物理法則をシミュレートすることでリアルな動きを作り出すが、まだワールドモデルとしては完全ではない。代わりに、カットシーン、トレーラー、ナラティブプロトタイピングなど、ゲームにおける映画的ストーリーテリングに使用される可能性がある。
リアルタイム制御可能シミュレーションという課題
このモデルはまた「パッシブアウトプット」生成モデルでもあり、より能動的で対話的、予測的なシミュレーターに移行する必要がある(Veo 3または将来のVeo世代で)。
しかし、ビデオゲーム制作における真の課題は印象的なビジュアルだけではなく、リアルタイムで一貫性があり制御可能なシミュレーションである。そのため、Googleがビデオゲームやプレイアブルワールド開発を追求する場合、VeoとGenieを活用するハイブリッドアプローチを採用することが理にかなっている可能性がある。
Googleは、Microsoft、Scenario、Runway、Pika、そして最終的にはOpenAIの動画生成モデルSoraと競合することになる可能性がある。ワールドモデル分野でのGoogleの計画的な動きと、潤沢な資金と流通力を使ってライバルを圧倒する同社の評判を考慮すると、この分野の競合他社は注意深く監視することが賢明だろう。
引用元: TechCrunch
Could Google’s Veo 3 be the start of playable world models?