OpenAI o3-pro発表、最高性能のAI推論モデルでGoogle Gemini 2.5 ProやAnthropic Claude 4 Opusを上回る

OpenAIが最高性能を謳うAI推論モデル「o3-pro」をリリース
ChatGPT ProとTeamユーザー向けに火曜日から提供開始、o1-proを置き換え
API価格は入力100万トークン20ドル（約2,800円）、出力100万トークン80ドル（約1万1,200円）
Google Gemini 2.5 ProやAnthropic Claude 4 Opusをベンチマークで上回る性能

OpenAI o3-proが最高性能のAI推論モデルとして登場

OpenAIは、同社が最も高性能と主張するAIモデル「o3-pro」を発表した。

o3-proは、OpenAIが今年初めに発表した推論モデルo3の強化版である。従来のAIモデルとは異なり、推論モデルは問題を段階的に解決するため、物理学、数学、プログラミングなどの分野でより確実な性能を発揮できる。

ChatGPT ProとTeamユーザー向けに火曜日から提供開始

o3-proは火曜日からChatGPT ProとTeamユーザー向けに提供開始され、o1-proモデルを置き换える。EnterpriseとEduユーザーは翌週にアクセス可能になるとOpenAIは述べている。o3-proは火曜日の午後からOpenAIの開発者API でも利用可能となった。

API価格は入力20ドル、出力80ドルで100万トークン当たり設定

o3-proのAPI価格は、入力100万トークン当たり20ドル（約2,800円）、出力100万トークン当たり80ドル（約1万1,200円）に設定されている。入力トークンはモデルに供給されるトークン、出力トークンはモデルが入力トークンに基づいて生成するトークンである。

100万入力トークンは約75万語に相当し、「戦争と平和」よりも少し長い分量となる。

OpenAI o3-pro has access to tools that make ChatGPT useful—it can search the web, analyze files, reason about visual inputs, use Python, personalize responses using memory, and more.

— OpenAI (@OpenAI) June 10, 2025

専門家評価でo3を全カテゴリで上回る性能を実証

「専門家による評価において、レビュワーはテストされた全カテゴリでo3-proをo3よりも一貫して好み、特に科学、教育、プログラミング、ビジネス、ライティング支援などの主要分野で顕著だった」とOpenAIは変更ログに記している。「レビュワーはまた、明確性、包括性、指示遵守、精度においてo3-proを一貫して高く評価した。」

Webサーチやファイル解析など多様なツール機能を搭載

OpenAIによると、o3-proはツールにアクセス可能で、Webサーチ、ファイル解析、視覚入力の推論、Python使用、メモリを活用した応答のパーソナライズなどが可能である。欠点として、モデルの応答はo1-proより完了に時間がかかるとOpenAIは述べている。

一部制限事項とGoogle Gemini、Anthropic Claudeを上回るベンチマーク結果

o3-proには他の制限もある。OpenAIが「技術的問題」を解決中のため、ChatGPTでのモデルとの一時的なチャットは現在無効になっている。o3-proは画像生成ができない。また、OpenAIのAI支援ワークスペース機能であるCanvasはo3-proでサポートされていない。

一方で、OpenAI内部テストによると、o3-proは人気のAIベンチマークで印象的なスコアを達成している。モデルの数学スキルを評価するAIME 2024では、o3-proはGoogleの最高性能AIモデルであるGemini 2.5 Proを上回るスコアを記録した。o3-proはまた、PhD レベルの科学知識をテストするGPQA Diamondにおいて、Anthropicが最近リリースしたClaude 4 Opusを上回っている。

引用元: TechCrunch
OpenAI releases o3-pro, a souped-up version of its o3 AI reasoning model