Gemini Deep Think AIをGoogleが公開、複数アイデアを並行検証する推論モデル

Google

  • Google DeepMindがGemini 2.5 Deep Thinkを公開、複数のAIエージェントが並行して問題を解決する初の一般向けマルチエージェントモデル
  • 月額250ドル(約3万7,500円)のUltraサブスクリプション加入者向けに金曜日から提供開始
  • 国際数学オリンピック(IMO)で金メダルを獲得した実績を持つ高度な推論AI
  • OpenAI、xAI、Anthropicの競合モデルを上回る性能をベンチマークテストで実証

Google DeepMindがマルチエージェント推論モデルを発表

Google DeepMindは8月1日、同社最先端のAI推論モデル「Gemini 2.5 Deep Think」を公開した。このモデルは複数のアイデアを同時に探索・検討し、それらの出力を基に最適な回答を選択する能力を持つ。

Googleの月額250ドル(約3万7,500円)のUltraサブスクリプション加入者は、金曜日からGeminiアプリでGemini 2.5 Deep Thinkにアクセス可能となる。

5月のGoogle I/O 2025で初めて発表されたGemini 2.5 Deep Thinkは、Googleが一般向けに提供する初のマルチエージェントモデルである。このシステムは複数のAIエージェントを生成し、問題に並行して取り組む仕組みを採用している。単一エージェントと比較して大幅に多くの計算資源を必要とするが、より優れた回答を生成する傾向がある。

GoogleはGemini 2.5 Deep Thinkの変形版を使用し、今年の国際数学オリンピック(IMO)で金メダルを獲得した実績を持つ。

研究者向けに特別版モデルを限定公開

Gemini 2.5 Deep Thinkと並行して、GoogleはIMOで使用したモデルを選抜された数学者および研究者グループに公開する。このAIモデルは一般消費者向けAIモデルが数秒から数分で処理するのに対し、「推論に数時間を要する」とGoogleは説明している。同社はIMOモデルが研究活動を促進し、学術利用向けマルチエージェントシステム改善のフィードバック獲得を目指している。

GoogleはGemini 2.5 Deep Thinkモデルが I/O発表時点から大幅な改善を遂げたと説明している。同社はまた、Gemini 2.5 Deep Thinkが推論経路をより効果的に活用するよう促進する「新しい強化学習技術」を開発したと発表した。

Googleはブログ投稿で「Deep Thinkは創造性、戦略的計画、段階的改善を必要とする問題への取り組みを支援できる」と述べている。

ベンチマークテストで競合他社を上回る性能を実証

Googleによると、Gemini 2.5 Deep ThinkはHumanity’s Last Exam(HLE)でstate-of-the-artの性能を達成している。HLEは数学、人文学、科学分野の数千のクラウドソーシング質問に対するAIの回答能力を測定する困難なテストである。Googleのモデルは(ツール使用なしで)34.8%のスコアを記録し、xAIのGrok 4の25.4%、OpenAIのo3の20.3%を上回った。

Googleはまた、Gemini 2.5 Deep ThinkがLiveCodeBench 6において、OpenAI、xAI、Anthropicの各AIモデルを上回る性能を示したと発表した。LiveCodeBench 6は競技プログラミングタスクの困難なテストである。Googleのモデルは87.6%のスコアを記録し、Grok 4の79%、OpenAIのo3の72%を上回った。

Gemini 2.5 Deep Thinkはコード実行やGoogle検索などのツールと自動連携し、従来のAIモデルと比較して「はるかに長い応答」を生成する能力を持つとGoogleは説明している。Googleのテストでは、このモデルは他のAIモデルと比較してより詳細で美的に優れたウェブ開発タスクを生成した。同社はこのモデルが研究者を支援し、「発見への道筋を潜在的に加速する」可能性があると主張している。

AI業界でマルチエージェント技術が主流に

複数の主要AIラボがマルチエージェントアプローチに収束しつつある状況が見て取れる。Elon Musk(イーロン・マスク)氏のxAIは最近、独自のマルチエージェントシステム「Grok 4 Heavy」を公開し、複数のベンチマークで業界をリードする性能を達成したと発表した。OpenAIの研究者Noam Brown(ノーム・ブラウン)氏はポッドキャストで、同社が今年のIMOで金メダル獲得に使用した未公開AIモデルもマルチエージェントシステムだったと述べた。一方、Anthropicの詳細な研究レポートを生成するResearch agentも、マルチエージェントシステムを基盤としている。

優れた性能にもかかわらず、マルチエージェントシステムは従来のAIモデルよりもさらに高いサービングコストがかかる模様である。そのため技術企業はこれらのシステムを最高額のサブスクリプションプランに限定する可能性があり、xAIに続いてGoogleもこの選択を行った。

Googleは今後数週間で、Gemini APIを通じて選抜されたテスターグループにGemini 2.5 Deep Thinkを提供する予定である。同社は開発者や企業がマルチエージェントシステムをどのように活用する可能性があるかをより深く理解したいとしている。

引用元: TechCrunch Google rolls out Gemini Deep Think AI, a reasoning model that tests multiple ideas in parallel https://techcrunch.com/2025/08/01/google-rolls-out-gemini-deep-think-ai-a-reasoning-model-that-tests-multiple-ideas-in-parallel/

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です