- Google DeepMindがインターネット接続不要でロボット上でローカル実行可能な新言語モデル「Gemini Robotics On-Device」を発表
- クラウド版Gemini Roboticsモデルに近い性能を実現し、自然言語プロンプトでロボットの動作制御が可能
- ALOHA、Franka FR3、Apollo humanoidロボットでの動作実証に成功
- 開発者向けにGemini Robotics SDKも同時リリース、50〜100回のデモンストレーションで新タスクの学習が可能
Google DeepMind、オフライン動作可能なGemini Robotics On-Deviceを発表
Google DeepMindは6月24日(火)、インターネット接続を必要とせずロボット上でローカルにタスクを実行できる新しい言語モデル「Gemini Robotics On-Device」をリリースした。
3月にリリースされた同社の従来のGemini Roboticsモデルをベースに構築されたGemini Robotics On-Deviceは、ロボットの動作を制御することができる。開発者は自然言語プロンプトを使用してモデルを制御し、様々なニーズに合わせて微調整することが可能だ。
クラウド版に匹敵する性能をベンチマークで実証
ベンチマークにおいて、GoogleはこのモデルがクラウドベースのGemini Roboticsモデルに近いレベルの性能を発揮すると主張している。同社によると、他のオンデバイスモデルを一般的なベンチマークで上回る性能を示しているが、具体的なモデル名は明かしていない。
ALOHA、Franka FR3、Apptronik Apolloロボットでの実演成功
デモンストレーションでは、このローカルモデルを実行するロボットがバッグのジッパーを開けたり、衣類を折りたたんだりする作業を行う様子が公開された。Googleは、このモデルがALOHAロボット向けに訓練されたものの、後に両腕を持つFranka FR3ロボットとApptronik社のApollo humanoidロボットでも動作するよう適応させたと説明している。
Googleによると、双腕Franka FR3は以前に「見た」ことのないシナリオや物体への対応に成功し、産業用ベルトでの組み立て作業などを実行することができたという。
Gemini Robotics SDK提供開始、MuJoCo物理シミュレーターでの学習に対応
Google DeepMindはGemini Robotics SDKもリリースした。同社によると、開発者はMuJoCo物理シミュレーター上でこれらのモデルを使用し、50〜100回のタスクデモンストレーションを示すことで、ロボットに新しいタスクを学習させることができる。
ロボティクス分野でのAIモデル開発競争が激化
他のAIモデル開発企業もロボティクス分野に参入している。Nvidiaはヒューマノイド向けファウンデーションモデルを作成するプラットフォームを構築中であり、Hugging Faceはロボティクス向けのオープンモデルとデータセットの開発に加えてロボット開発にも取り組んでいる。また、Mirae Asset出資の韓国スタートアップRLWRLDもロボット向けファウンデーションモデルの創出に取り組んでいる。
引用元:TechCrunch
Google rolls out new Gemini model that can run on robots locally