OpenAIが新AIモデル「o3」と「o4-mini」を発表、思考プロセスを経て回答する推論モデル

OpenAI ChatGPT

  • OpenAIが回答前に「考える」AIモデル「o3」と「o4-mini」をリリース
  • o3は同社史上最も高度な推論モデルで数学、コーディング、視覚理解などで優れた性能
  • 両モデルはウェブ検索、コード実行、画像処理など多様なツール活用が可能
  • 価格や性能面でGPT-5登場前の最後の単独推論モデルとなる可能性

OpenAIの最先端推論モデル登場

OpenAIは水曜日、質問に回答する前に一時停止して考える新しいAI推論モデル「o3」と「o4-mini」の発表を行った。同社はo3を、数学、コーディング、推論、科学、視覚理解能力を測定するテストで同社の以前のモデルを上回る「史上最も高度な推論モデル」と位置づけている。一方、o4-miniは開発者がアプリケーション用AIモデルを選択する際に考慮する価格、速度、性能の間で競争力のあるトレードオフを提供するという。

以前の推論モデルとは異なり、o3とo4-miniはChatGPTのウェブ閲覧、Pythonコード実行、画像処理、画像生成などのツールを使用して回答を生成できる。本日から、これらのモデルと、信頼性を向上させるために回答作成により多くの時間を費やす「o4-mini-high」と呼ばれるo4-miniのバリアントが、OpenAIのPro、Plus、Teamプラン契約者に提供される。

激化するAI競争の中での戦略的発表

新モデルは、OpenAIがGoogle、Meta、xAI、Anthropic、DeepSeekなどを凌駕するための取り組みの一環だ。OpenAIは最初の推論モデル「o1」をリリースしたが、競合他社はすぐにOpenAIのラインナップと同等または上回る性能を持つ独自バージョンで追随した。実際、AIラボがシステムからより多くのパフォーマンスを引き出そうとする中、推論モデルが業界を支配し始めている。

o3はほぼChatGPTでリリースされなかった可能性もあった。2月にはOpenAIのCEOであるSam Altman(サム・オルトマン)氏が、o3の技術を組み込んだより洗練された代替案に多くのリソースを投入する意向を示していた。しかし競争圧力により、最終的にOpenAIは方針を転換したようだ。

性能比較と技術的優位性

OpenAIによれば、o3はコーディング能力を測定するテスト「SWE-bench verified」(カスタムスキャフォールディングなし)で69.1%を記録し、最先端の性能を達成している。o4-miniモデルも68.1%を記録し、同様の性能を実現した。OpenAIの次に良いモデルであるo3-miniはこのテストで49.3%を記録し、Claude 3.7 Sonnetは62.3%だった。

OpenAIはo3とo4-miniが「画像で考える」ことができる同社初のモデルだと主張している。実際には、ユーザーはホワイトボードのスケッチやPDFからの図などの画像をChatGPTにアップロードでき、モデルは回答する前の「思考の連鎖」フェーズでそれらの画像を分析する。この新しい能力により、o3とo4-miniはぼやけた低品質の画像を理解し、推論しながら画像のズームや回転などのタスクを実行できる。

開発者向け機能と価格戦略

画像処理機能に加えて、o3とo4-miniはChatGPTのCanvas機能を通じてブラウザ上で直接Pythonコードを実行でき、現在のイベントについて質問されたときにウェブを検索することができる。

ChatGPTに加えて、3つのモデル全て(o3、o4-mini、o4-mini-high)はOpenAIの開発者向けエンドポイントであるChat Completions APIとResponses APIを通じて利用可能となり、エンジニアは使用量ベースの料金で同社のモデルを使用したアプリケーションを構築できるようになる。

OpenAIはo3の性能向上にもかかわらず、100万入力トークン(約75万語、「指輪物語」シリーズより長い)あたり10ドル(約1,500円)、100万出力トークンあたり40ドル(約6,000円)という比較的低価格で開発者に提供している。o4-miniについては、OpenAIはo3-miniと同じ価格、100万入力トークンあたり1.10ドル(約165円)、100万出力トークンあたり4.40ドル(約660円)を設定している。

今後の展開とGPT-5への布石

OpenAIは今後数週間で、より多くの計算リソースを使用して回答を生成するo3のバージョン「o3-pro」をChatGPT Proユーザー限定でリリースする予定だという。

OpenAIのCEO、Sam Altman氏はo3とo4-miniが、GPT-4.1のような従来のモデルと推論モデルを統合すると同社が述べているGPT-5の前の、ChatGPTにおける最後の単独AIモデルになる可能性を示唆している。

引用元:TechCrunch
OpenAI launches a pair of AI reasoning models, o3 and o4-mini

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です