Meta V-JEPA 2、AI物理世界理解モデルで周囲環境認識を大幅向上

MetaがV-JEPA 2 AIモデルを発表、AIエージェントの物理世界理解を向上
100万時間以上の動画データで訓練された「ワールドモデル」技術
Nvidia Cosmosモデルと比較して30倍高速の処理性能を実現
ロボット工学における実用的なAIエージェント開発への応用期待

Meta V-JEPA 2の革新的物理世界理解技術

Metaは6月11日、新しいV-JEPA 2 AIモデルを発表した。このモデルは「ワールドモデル」として設計されており、AIエージェントが周囲の世界を理解することを支援する。V-JEPA 2は、Metaが昨年リリースしたV-JEPAモデルの拡張版で、100万時間以上の動画データで訓練されている。

この訓練データは、ロボットや他のAIエージェントが物理世界で動作し、重力などの概念が次に起こることにどのような影響を与えるかを理解し予測することを支援する目的で設計されている。これらは小さな子供や動物の脳が発達する際に作る常識的な接続と同様のものだ。例えば、犬と球遊びをする際、犬は地面でボールが跳ねることで上向きに反発することを理解し、ボールが現在ある位置ではなく、着地すると思われる場所に向かって走る。