OpenAI、「コードレッド」後にGPT-5.2でGoogleに反撃

OpenAI Google

  • OpenAIが最新モデルGPT-5.2を発表、コーディング・数学・科学分野で新たなベンチマークスコアを達成
  • Google Gemini 3のDeep Thinkモードとの直接競争を展開、ほぼすべての推論テストで優位性を示す
  • Sam Altman CEOの内部「コードレッド」メモを受けての発表、ChatGPTトラフィック減少への対応策
  • 1.4兆ドル(約210兆円)のAIインフラ投資を背景に、推論モデルへの注力がコスト増大のリスクも

GPT-5.2の3つのバージョンと特徴

OpenAIは木曜日、Googleとの競争激化の中で最新のフロンティアモデルGPT-5.2を発表した。同社はこれを最も高度なモデルであり、開発者と日常的な業務利用向けに設計されたものとして位置付けている。

GPT-5.2はChatGPT有料ユーザーと開発者向けにAPI経由で3つのフレーバーで提供される。Instantは情報検索、執筆、翻訳などの日常的なクエリ向けに速度最適化されたモデル。Thinkingはコーディング、長文書の分析、数学、計画立案などの複雑な構造化作業に優れたモデル。そしてProは困難な問題に対して最大限の精度と信頼性を提供することを目的としたトップエンドモデルとなる。

「5.2は人々にさらなる経済的価値を引き出すために設計した」と、OpenAIの最高プロダクト責任者であるFidji Simo(フィジ・シモ)氏は木曜日のジャーナリスト向けブリーフィングで語った。「スプレッドシートの作成、プレゼンテーションの構築、コードの記述、画像の認識、長いコンテキストの理解、ツールの使用、そして複雑な複数ステップのプロジェクトをリンクすることにおいて優れている」

Google Gemini 3との激しい競争

GPT-5.2はGoogle Gemini 3との軍拡競争の真っ只中に登場した。Gemini 3は現在、コーディングを除くほとんどのベンチマークでLMArenaのリーダーボードのトップに立っている(コーディングについてはAnthropicのClaude Opus-4.5が依然としてロックしている)。

今月初め、The Informationは、Sam Altman(サム・アルトマン)CEOがChatGPTのトラフィック減少とGoogleへの消費者市場シェア喪失への懸念の中で、スタッフに対して内部「コードレッド」メモを発表したと報じた。コードレッドは広告導入などのコミットメントを停止し、代わりにより良いChatGPT体験の創出に焦点を当てるという優先順位の転換を求めるものだった。

Gemini 3がGoogleの製品とクラウドエコシステムにマルチモーダルとエージェンティックワークフロー向けに緊密に統合される中で、この動きが起こっている。Googleは今週、MapsやBigQueryなどのGoogleおよびCloudサービスをエージェントがプラグインしやすくするマネージドMCPサーバーを立ち上げた(MCPはAIシステムとデータ・ツールの間のコネクタである)。

ベンチマークテストでの優位性

OpenAIはGPT-5.2がコーディング、数学、科学、ビジョン、長文コンテキスト推論、ツール使用において新たなベンチマークスコアを設定したと述べており、同社はこれが「より信頼性の高いエージェンティックワークフロー、プロダクショングレードのコード、大規模なコンテキストと実世界のデータにわたって動作する複雑なシステム」につながる可能性があると主張している。

これらの能力は、数学、論理、科学を対象とした主要な推論の進歩として喧伝されているGemini 3のDeep Thinkモードと直接競合する。OpenAI自身のベンチマークチャートでは、GPT-5.2 ThinkingがGemini 3とAnthropicのClaude Opus 4.5を、実世界のソフトウェアエンジニアリングタスク(SWE-Bench Pro)や博士レベルの科学知識(GPQA Diamond)から抽象的推論とパターン発見(ARC-AGIスイート)まで、ほぼすべての推論テストで上回っている。

研究リーダーのAidan Clark(エイダン・クラーク)氏は、より強力な数学スコアは単に方程式を解くことだけではないと述べた。数学的推論は、モデルが複数ステップの論理に従い、時間経過とともに数値の一貫性を保ち、時間とともに複合する可能性のある微妙なエラーを回避できるかどうかの代理指標であると彼は説明した。

「これらはすべて、さまざまな幅広いワークロードにわたって本当に重要な特性だ」とClark氏は語った。「財務モデリング、予測、データ分析などのようなものだ」

コーディングとデバッグの大幅改善

ブリーフィング中、OpenAIのプロダクトリーダーであるMax Schwarzer(マックス・シュワルツァー)氏はGPT-5.2が「コード生成とデバッグに大幅な改善をもたらす」と述べ、複雑な数学と論理をステップバイステップで進めることができると語った。WindsurfやCharlieCodeのようなコーディングスタートアップは、「最先端のエージェントコーディングパフォーマンス」と複雑な複数ステッププロセスでの測定可能な向上を報告していると彼は付け加えた。

コーディングを超えて、Schwarzer氏はGPT-5.2 Thinkingの応答が前世代と比較して38%少ないエラーを含んでおり、日々の意思決定、研究、執筆においてモデルをより信頼できるものにしていると述べた。

OpenAI戦略の統合と進化

GPT-5.2は革命というよりも、OpenAIの過去2回のアップグレードの統合のように見える。8月にドロップしたGPT-5は、高速デフォルトモデルとより深い「Thinking」モード間でモデルを切り替えるルーターを備えた統一システムの基礎を築くリセットだった。11月のGPT-5.1は、そのシステムをより温かく、会話的で、エージェンティックおよびコーディングタスクに適したものにすることに焦点を当てた。最新モデルのGPT-5.2は、これらすべての進歩のダイヤルを上げ、プロダクション利用のためのより信頼性の高い基盤にしているようだ。

1.4兆ドルの賭けとコスト圧力

OpenAIにとって、これまでにないほど高い賭けとなっている。同社は成長を支えるため、今後数年間でAIインフラ構築に1.4兆ドル(約210兆円)規模のコミットメントを行っている。これは、AI企業の中でファーストムーバーアドバンテージを持っていた時に行ったコミットメントだ。しかし今、当初は遅れをとっていたGoogleが前進を続けており、その賭けがAltman氏の「コードレッド」を駆り立てているものかもしれない。

OpenAIが推論モデルに再び焦点を当てることも、リスクの高い賭けだ。ThinkingとDeep Researchモードの背後にあるシステムは、より多くの計算リソースを消費するため、標準的なチャットボットよりも実行コストが高い。GPT-5.2でそのようなモデルを倍増させることで、OpenAIは悪循環を招いている可能性がある。リーダーボードで勝つためにより多くの計算リソースに費やし、次にそれらの高コストモデルを大規模で実行し続けるためにさらに多くを費やすというサイクルだ。

OpenAIはすでに以前に明らかにしていたよりも多くの計算リソースに費やしていると報じられている。TechCrunchが最近報じたように、OpenAIの推論支出の大部分(訓練済みAIモデルを実行するために費やす計算リソースの費用)は、クラウドクレジットではなく現金で支払われており、同社の計算コストがパートナーシップとクレジットが補助できる範囲を超えて成長していることを示唆している。

通話中、Simo氏はOpenAIがスケールするにつれて、追加の計算リソースに支払うためのより多くの収益を生み出すために、より多くの製品とサービスを提供できるようになると示唆した。

「しかし、それを効率性の壮大なアークの中に位置付けることが重要だと思う」とSimo氏は語った。「今日、1年前と同じ量の計算リソースと同じ金額で、はるかに多くの知能を得ている」

画像生成への今後の対応

推論への焦点にもかかわらず、今日の発表から欠けているものの1つは新しい画像ジェネレーターだ。Altman氏は伝えられるところによれば、コードレッドメモの中で、特にGoogleのNano Banana(GoogleのGemini 2.5 Flash Imageモデルのニックネーム)が8月のリリース後にバイラルな瞬間を経験した後、画像生成が今後の重要な優先事項になると述べたと報じられている。

先月、GoogleはNano Banana Pro(別名Gemini 3 Pro Image)を立ち上げた。これはさらに優れたテキストレンダリング、世界知識、そして写真への不気味なほどリアルで未編集の雰囲気を持つアップグレード版だ。また、過去1週間に示されたように、自動プレゼンテーション生成のためのGoogle Labs Mixboardなどのツールやワークフローにポップアップするように、Google製品全体により良く統合されている。

OpenAIは伝えられるところによれば、より優れた画像、改善された速度、より良いパーソナリティを備えた別の新しいモデルを1月にリリースする計画だが、同社は木曜日にこれらの計画を確認しなかった。

OpenAIはまた木曜日に、メンタルヘルス利用と10代の年齢確認に関する新しい安全対策を展開していると述べたが、これらの変更を売り込むことにローンチの大部分を費やさなかった。

この記事は、OpenAIの計算効率ステータスに関する詳細情報で更新されている。

引用元:TechCrunch「OpenAI fires back at Google with GPT-5.2 after ‘code red’ memo」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です