- MetaがV-JEPA 2 AIモデルを発表、AIエージェントの物理世界理解を向上
- 100万時間以上の動画データで訓練された「ワールドモデル」技術
- Nvidia Cosmosモデルと比較して30倍高速の処理性能を実現
- ロボット工学における実用的なAIエージェント開発への応用期待
Meta V-JEPA 2の革新的物理世界理解技術
Metaは6月11日、新しいV-JEPA 2 AIモデルを発表した。このモデルは「ワールドモデル」として設計されており、AIエージェントが周囲の世界を理解することを支援する。V-JEPA 2は、Metaが昨年リリースしたV-JEPAモデルの拡張版で、100万時間以上の動画データで訓練されている。
この訓練データは、ロボットや他のAIエージェントが物理世界で動作し、重力などの概念が次に起こることにどのような影響を与えるかを理解し予測することを支援する目的で設計されている。これらは小さな子供や動物の脳が発達する際に作る常識的な接続と同様のものだ。例えば、犬と球遊びをする際、犬は地面でボールが跳ねることで上向きに反発することを理解し、ボールが現在ある位置ではなく、着地すると思われる場所に向かって走る。
実用的応用例とロボット工学への影響
Metaは、ロボットが皿とヘラを持ってコンロに向かい、調理された卵に直面する場面などの例を示している。AIは、非常に可能性の高い次の行動として、ヘラを使って卵を皿に移すことを予測できる。
Metaによると、V-JEPA 2は物理世界に関連する知能向上を試みるNvidiaのCosmosモデルと比較して30倍高速だという。ただし、MetaとNvidiaは異なるベンチマークに基づいて自社モデルを評価している可能性がある。
Yann LeCun氏によるロボット工学の未来展望
MetaのチーフAIサイエンティストであるYann LeCun(ヤン・ルカン)氏は動画で「ワールドモデルはロボット工学の新時代を切り開き、天文学的な量のロボット訓練データを必要とすることなく、実世界のAIエージェントが家事や物理的タスクを支援できるようになると信じている」と説明した。
AI技術の進歩と実用化への道筋
V-JEPA 2の技術は、AIエージェントが物理法則を理解し、予測可能な行動パターンを学習することで、より自然で効率的なロボット操作を可能にする。この技術革新により、従来必要とされていた膨大な訓練データなしに、実用的なAIアシスタントの開発が現実的になる可能性が高まっている。
引用元: TechCrunch
Meta’s V-JEPA 2 model teaches AI to understand its surroundings