- OpenAIがAIコーディングエージェントCodex向けにGPT-5-Codex新モデルをリリース
- 数秒から最大7時間まで動的に「思考時間」を調整する画期的機能を搭載
- SWE-bench Verifiedベンチマークでエージェンティックコーディング性能が向上
- ChatGPT Plus・Pro・Business・Edu・Enterprise全ユーザーに順次展開開始
OpenAIがGPT-5-Codexで動的思考機能を実現
OpenAIは月曜日、AIコーディングエージェントCodexに対してGPT-5の新バージョンをリリースすると発表した。同社によると、GPT-5-Codexと呼ばれる新モデルは、従来のモデルよりも動的に「思考」時間を費やし、コーディングタスクに対して数秒から7時間まで時間をかけることができる。その結果、エージェンティックコーディングベンチマークでより優れた性能を発揮している。
新モデルは現在、ターミナル、IDE、GitHub、またはChatGPT経由でアクセス可能なCodex製品において、ChatGPT Plus、Pro、Business、Edu、Enterpriseの全ユーザーに展開されている。OpenAIは将来的にAPIユーザーにもモデルを提供する計画だと述べている。
AI コーディングツール市場での競争力強化が狙い
このアップデートは、Claude Code、AnysphereのCursor、MicrosoftのGitHub Copilotなど、他のAIコーディング製品との競争力を高めるOpenAIの取り組みの一環である。激しいユーザー需要の結果、AIコーディングツール市場は昨年大幅に競争が激化している。Cursorは2025年初めに年間経常収益(ARR)5億ドル(約750億円)を突破し、類似のコードエディタであるWindsurfは、チームがGoogleとCognitionの間で分裂する混沌とした買収試行の対象となった。
SWE-bench Verifiedベンチマークで性能向上を実証
OpenAIは、GPT-5-Codexがエージェンティックコーディング能力を測定するベンチマークであるSWE-bench Verified、および大規模で確立されたリポジトリからのコードリファクタリングタスクでの性能を測定するベンチマークにおいて、GPT-5を上回る性能を示していると述べている。
経験豊富なエンジニアがコードレビュー品質を評価
同社はまた、GPT-5-Codexをコードレビューの実施のために訓練し、経験豊富なソフトウェアエンジニアにモデルのレビューコメントを評価するよう依頼した。エンジニアらは、GPT-5-Codexが不正確なコメントの提出を減らしながら、より多くの「高インパクトコメント」を追加することを発見したと報告されている。
Alexander Embiricos氏が動的思考能力の仕組みを解説
ブリーフィングにおいて、OpenAIのCodex製品責任者Alexander Embiricos(アレクサンダー・エンビリコス)氏は、性能向上の多くがGPT-5-Codexの動的な「思考能力」によるものだと述べた。ユーザーはタスクの複雑さに基づいて異なるモデルにクエリを送信するChatGPTのGPT-5ルーターに馴染みがあるかもしれない。Embiricos氏は、GPT-5-Codexは類似的に動作するが、内部にルーターを持たず、タスクにどれだけ時間をかけるかをリアルタイムで調整できると述べた。
Embiricos氏は、これは問題の開始時に問題に使用する計算能力と時間を決定するルーターと比較して利点だと述べている。代わりに、GPT-5-Codexは問題に取り組んで5分後に、さらに1時間費やす必要があると判断できる。Embiricos氏は、場合によってはモデルが7時間以上かかるのを見たことがあると述べた。
AIコーディング分野での技術革新が加速
今回のGPT-5-Codexの発表は、AI コーディング分野における技術革新の加速を示している。従来の固定的な処理時間とは異なり、問題の複雑さに応じて動的に思考時間を調整する能力は、より人間らしい問題解決アプローチを実現している。
この技術的進歩は、ソフトウェア開発プロセスの自動化において重要なマイルストーンを示しており、開発者の生産性向上とコード品質の改善に大きく貢献することが期待される。
引用元:TechCrunch OpenAI upgrades Codex with a new version of GPT-5
https://techcrunch.com/2025/09/15/openai-upgrades-codex-with-a-new-version-of-gpt-5/