- OpenAIが自律的にウェブブラウジングとソフトウェア操作を行うOperatorエージェントのAIモデルをGPT-4oベースからo3ベースにアップグレード
- o3は数学と推論タスクで大幅に性能が向上した最新の「推論」モデル
- 新しいo3 Operatorは安全性データで追加ファインチューニングされ、不正な活動への拒否率と機密データ検索の抑制を改善
- Google、Anthropicなど他社もエージェント技術の開発競争を激化させている状況
OpenAI、Operatorエージェントの中核モデルを大幅刷新
OpenAIは、ウェブを自律的にブラウジングし、クラウドホスティング仮想マシン内で特定のソフトウェアを使用してユーザーのリクエストを実行するAIエージェント「Operator」を動かすAIモデルをアップデートすると発表した。間もなく、Operatorは同社の最新「推論」モデルシリーズであるoシリーズの一つ、o3をベースとしたモデルを使用する予定だ。これまでOperatorはGPT-4oのカスタムバージョンに依存していた。
多くのベンチマークにおいて、o3は特に数学と推論を含むタスクで、はるかに高度なモデルとなっている。OpenAIはブログ投稿で「既存のGPT-4oベースのOperatorモデルをOpenAI o3ベースのバージョンに置き換える。API版(Operator)は引き続き4oベースのままとする」と述べた。
Operator 🤝 OpenAI o3
Operator in ChatGPT has been updated with our latest reasoning model.https://t.co/gGhvuyz5HB
— OpenAI (@OpenAI) May 23, 2025
AI企業間でエージェント技術開発競争が激化
Operatorは、ここ数ヶ月でAI企業がリリースした多くのエージェントツールの一つである。各企業は、監督をほとんど必要とせずに確実に作業を実行できる高度に洗練されたエージェントの開発競争を繰り広げている。Googleは、同様にウェブをブラウジングしてユーザーに代わってアクションを実行できる「コンピューター使用」エージェントをGemini API経由で提供しており、より消費者向けの「Mariner」という製品も展開している。Anthropicのモデルも、ファイルを開いたりウェブページを操作したりするコンピュータータスクを実行する能力を持っている。
o3 Operator、安全性データで追加ファインチューニング実施
OpenAIによると、「o3 Operator」と呼ばれる新しいOperatorモデルは「コンピューター使用のための追加安全性データでファインチューニング」されており、これには「確認と拒否に関するモデル(OpenAI)の決定境界を教える」ように設計されたデータセットが含まれている。
OpenAIはo3 Operatorの特定の安全性評価でのパフォーマンスを示す技術レポートを公開した。技術レポートによると、GPT-4o Operatorモデルと比較して、o3 Operatorは「不正な」活動の実行を拒否し、機密の個人データを検索する可能性が低く、プロンプトインジェクションとして知られるAI攻撃の一形態に対する耐性も向上している。
OpenAIはブログ投稿で「o3 Operatorは、Operatorの4oバージョンで使用していたのと同じ多層安全性アプローチを使用している。o3 Operatorはo3のコーディング機能を継承しているが、コーディング環境やターミナルへのネイティブアクセスは持っていない」と述べた。
引用元:TechCrunch
OpenAI upgrades the AI model powering its Operator agent