GPT-5がついに登場、OpenAIが次世代AI統合モデルを正式発表

OpenAI ChatGPT

  • OpenAIがGPT-5を正式リリース、推論能力と高速応答を統合した次世代AIモデル
  • SWE-bench Verifiedで74.9%のスコアを記録、Anthropic Claude Opus 4.1の74.5%を上回る
  • 幻覚現象が4.8%まで大幅改善、従来のGPT-4oの20.6%から大きく進歩
  • 全ChatGPTユーザーがデフォルトモデルとして無料利用可能、月額20ドル(約3,000円)のPlusプランでは利用制限拡大

Sam Altman氏が「世界最高のモデル」と豪語するGPT-5の実力

GPT-5への期待は高い。これは2022年にChatGPTが同社を一躍有名にして以来、OpenAIの最も注目される製品発表の一つだ。それ以来、ChatGPTは世界で最も人気のある消費者向け製品の一つに成長し、同社によると毎週7億人以上のユーザーに達している。これは世界人口のほぼ10%に相当する。

多くの人がGPT-5をAI進歩全体の指標として見ており、シリコンバレーによるこのモデルの受け入れは、ビッグテック、ウォール街、そしてテクノロジーを規制する政策立案者に深刻な影響を与える可能性がある。これらの利害関係者は、GPT-5がAI能力の大幅な飛躍を提供するかどうかを注視している。前モデルのGPT-4がソフトウェアにできることへの期待を覆したのと同様に。

記者会見でOpenAI CEOのSam Altman(サム・アルトマン)氏はGPT-5を「世界最高のモデル」と主張し、経済的に価値のある作業の大部分で人間を上回るAI、つまり汎用人工知能(AGI)の開発に向けた同社の道筋における「重要な一歩」であると述べた。

「GPT-5のようなものを持つことは、歴史上これまでのどの時代でもほぼ想像できないことだっただろう」とAltman氏は語った。

Anthropic Claude、Google DeepMind、xAI Grokとのベンチマーク比較

OpenAIはGPT-5がいくつかの分野で最先端であると主張し、主要なベンチマークでAnthropic、Google DeepMind、Elon Musk(イーロン・マスク)氏のxAIの主要AIモデルをわずかに上回っている。しかし、GPT-5は他の分野では最先端AIモデルをわずかに下回る性能を示している。

同社はGPT-5がコーディング周辺で最先端レベルの性能を提供すると述べている。Altman氏は、このモデルが特に「vibe coding」として知られるようになった、要求に応じて完全なソフトウェアアプリケーションを立ち上げることに優れていると述べた。

GitHubから取得した実世界のコーディングタスクのテストであるSWE-bench Verifiedで、GPT-5は初回試行で74.9%のスコアを記録した。これはAnthropicの最新Claude Opus 4.1モデルの74.5%、Google DeepMindのGemini 2.5 Proの59.6%をわずかに上回る性能だ。

数学、人文学、自然科学全体でのAIモデル性能を測定する難しいテストであるHumanity’s Last Examでは、拡張推論を持つGPT-5バージョン(GPT-5 Pro)がツール使用時に42%のスコアを記録した。これはxAIがGrok 4 Heavyで達成した44.4%をわずかに下回る結果だった。

PhD レベル科学問題とヘルスケア分野での高精度を実現

PhD レベルの科学問題のテストであるGPQA Diamondで、GPT-5 proは初回試行で89.4%のスコアを記録し、Claude Opus 4.1の80.9%、Grok 4 Heavyの88.9%を上回った。

OpenAIはGPT-5が健康関連の質問により適していると述べている。ヘルスケアトピック周辺でのAIモデル応答の精度を測定するテストであるHealthBench Hard Hallucinationsで、OpenAIはGPT-5(思考機能付き)が1.6%の時間しか幻覚を起こさないと述べている。これは同社の以前のGPT-4oと03モデルがそれぞれ12.9%と15.8%を記録したのに比べてはるかに低い数値だ。

AIチャットボットは医療従事者ではないが、数百万人の人々が健康アドバイスのためにそれらを使用している。この現象に対応して、同社はGPT-5が潜在的な健康問題にフラグを立て、ユーザーが医療結果を解析するのを支援することにより積極的だと述べている。

創造的デザインと文章作成での主観的評価向上

さらに、OpenAIはGPT-5が創造的デザインや文章作成などの測定が困難でより主観的な分野で、他のAIモデルより優れていると述べている。OpenAIのChatGPT担当VPであるNick Turley(ニック・タリー)氏はGPT-5がより自然に応答し、創造的タスクで他のAIモデルより「より良い味」を示すと述べた。

「このモデルの雰囲気は本当に良い」とTurley氏は語った。

GPT-5はOpenAIの以前のモデルよりも正確で、同社はo-seriesモデルと比較して、AIモデルが情報を作り上げる傾向である幻覚に苦しむことがはるかに少ないと述べている。OpenAIの最新AI推論モデルであるo3などでは幻覚が悪化しているようで、OpenAIは以前になぜそれが起こっているのか完全には理解していないと述べていた。

ChatGPTプロンプトへの応答で、OpenAIはGPT-5(思考機能付き)が4.8%の時間で幻覚を起こし、誤った情報で応答することを発見した。これはテストで幻覚率22%と20.6%をそれぞれ記録したo3とGPT-4oからの大幅な削減だ。

エージェント機能とオンラインタスク実行能力の評価

シミュレートされたオンラインタスクを完了するAIモデルのエージェント能力を測定するベンチマークであるTau-benchで、GPT-5は混合的な性能を示した。航空会社のウェブサイトをナビゲートするAI能力を測定するテストの部分で、GPT-5は63.5%のスコアを記録し、64.8%を記録したo3をわずかに下回った。小売ウェブサイトをナビゲートするAI能力を測定するテストの別の部分で、GPT-5は81.1%のスコアを記録し、82.4%を記録したClaude Opus 4.1を下回った。

OpenAIはまた、GPT-5が以前のモデルよりも安全だと述べている。AI推論モデルが時折人間に対して策略を練ったり、自分の目標を推進するために嘘をついたりする傾向を示すことがある一方で、OpenAIはGPT-5が他のモデルよりも低い率で欺瞞的であることを発見した。

OpenAIの安全研究リーダーであるAlex Beutel(アレックス・ボイテル)氏は、欺瞒を減らすことはGPT-5の安全性だけでなくユーザー体験も向上させ、ユーザーが信頼できる方法でより「透明で正直な」モデルを作ることだと述べた。

ChatGPTユーザー向けの新機能と料金体系

ChatGPTはGPT-5の発表の一環として、いくつかのユーザー体験のアップグレードを受ける。ユーザーは現在、ChatGPTの設定でCynic、Robot、Listener、Nerdの4つの新しい個性から選択できる。同社はこれらがユーザーに特定の方法で応答するよう具体的に求めることなく、ChatGPTの応答を適応させると述べている。

ChatGPTの月額20ドル(約3,000円)のPlusプラン加入者は、無料ユーザーよりもGPT-5の使用制限が高くなる。一方、月額200ドル(約3万円)のPro加入者は、GPT-5への無制限アクセスに加えて、より良い答えを生成するために追加の計算リソースを使用するGPT-5 Proと呼ばれる強化バージョンにアクセスできる。OpenAIのTeam、Edu、EnterpriseプランのOrganizationは来週、デフォルトモデルとしてGPT-5にアクセスできるようになる。

開発者向けAPI提供と価格設定詳細

開発者向けに、GPT-5はOpenAIのAPIに3つのサイズ(gpt-5、gpt-5-mini、gpt-5-nano)で提供される。これらはタスクを「推論」する時間が多かれ少なかれ異なる。開発者はOpenAI APIで冗長性を制御し、AIモデルの応答がどの程度長いか短いかを決定することもできるようになった。

GPT-5のベースモデルは、開発者にとって100万入力トークンあたり1.25ドル(約190円)(大体75万語、「指輪物語」シリーズ全体より長い)、100万出力トークンあたり10ドル(約1,500円)のコストがかかる。

OpenAI社の積極的な製品展開戦略

GPT-5の発表は、OpenAIにとって忙しい週の後に来る。同社は開発者と企業が無料でダウンロードし、コストのほんの一部で実行できるオープンウェイト推論モデルgpt-ossをリリースした。このオープンモデルはOpenAIの以前のトップモデルであるo3とo4-miniの能力にほぼ匹敵したが、GPT-5はコーディングなどの一部分野で最先端性能の新しい標準を設定している。

木曜日から、GPT-5はすべてのChatGPT無料ユーザーにデフォルトモデルとして利用可能になる。OpenAIのChatGPT担当VPであるNick Turley氏は、これが同社が無料ユーザーに初めてAI推論モデルへのアクセスを提供する取り組みの一部だと述べた(以前、同社はこれらのより高度なモデルを有料の壁の後ろに門番していた)。

「これは私がミッションを実現することに興奮している方法の一つであり、このようなものが実際に人々に利益をもたらすことを確実にすることだ」とTurley氏は、可能な限り多くの人に高度なAIを配布するというOpenAIの長年のミッションに言及しながら、この決定について述べた。

しかし、GPT-5はいくつかの分野で他の最先端AIモデルとほぼ同等のようだ。もちろん、ベンチマークはどのAIモデルについても物語の一部しか語らない。開発者が実世界でGPT-5をどのように使用するか、そしてモデルが本当に競合他社より一歩上であるかどうかは、まだ見守る必要がある。

引用元:TechCrunch OpenAI’s GPT-5 is here

https://techcrunch.com/2025/08/07/openais-gpt-5-is-here/

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です