- OpenAIが新型AI推論モデル「o3-mini」を発表
- 従来モデルと比較して39%のエラー低減と24%の処理速度向上を達成
- ChatGPTの各種プランで利用可能、API経由での提供も開始
- 100万トークンあたり入力0.55ドル、出力4.40ドルの価格設定
OpenAIによる「o3-mini」の発表
OpenAIは金曜日、同社の推論モデルファミリーの最新版となる「o3-mini」を発表した。同モデルは12月に予告されていた、より高性能な「o3」と同時に開発されたものである。o3-miniは科学、数学、コーディングに特に優れた、強力で高速な推論モデルと発表している。今回の発表は、同社の野心と課題が日々拡大する重要な時期に行われた。
OpenAIは現在、DeepSeek等の中国企業に対するAI開発競争での優位性維持に課題を抱えており、特にDeepSeekについては知的財産権の侵害を主張している。一方で、多くの開発者の支持を獲得し、大規模なデータセンタープロジェクトを進めながら、ワシントンとの関係強化にも努めている。また、テクノロジー企業史上最大規模となる資金調達の準備も進めているとされる。
OpenAI o3-mini is a powerful and fast reasoning model that is particularly strong in science, math, and coding. https://t.co/P48CSz1Ar9
— OpenAI (@OpenAI) January 31, 2025
o3-miniの性能と特徴
o3-miniは、プログラミング、数学、科学といったSTEM分野に特化した調整が施されている。OpenAIによると、外部テスターの過半数が従来モデルのo1-miniと比較してo3-miniの回答を好み、「困難な実世界の質問」に対する重大な誤りが39%減少し、回答速度も24%向上したとしている。
利用可能性と価格設定
o3-miniは金曜日からChatGPTの全ユーザーが利用可能となる。ChatGPT PlusとTeamプランの利用者は1日150クエリの制限付きで、Proプランの利用者は無制限で利用できる。ChatGPT EnterpriseとEduの顧客には1週間後に提供開始予定だ。
APIの価格設定については、100万入力トークンあたり0.55ドル(約82円)、100万出力トークンあたり4.40ドル(約660円)となっており、これはo1-miniと比べて63%低い価格設定である。また、DeepSeekのR1推論モデルの価格(100万入力トークンあたり0.14ドル(約21円)、100万出力トークンあたり2.19ドル(約328円))と競争力のある水準となっている。
ベンチマーク性能と制限事項
o3-miniは、高推論努力設定時にAIME 2024テストやSWE-bench VerifiedテストでわずかながらR1を上回る性能を示している。一方、低推論努力設定では、PhD級の物理学、生物学、化学の質問を扱うGPQA Diamondテストでは、R1に劣る結果となっている。
OpenAIは、同社の「熟考的整合性」手法により、o3-miniは従来のo1ファミリーと同等以上の安全性を確保していると主張。特に、GPT-4oと比較して「困難な安全性評価とジェイルブレイクテスト」で「大幅な優位性」を示したとしている。
引用元:TechCrunch
OpenAI launches o3-mini, its latest ‘reasoning’ model