Google Gemini、「ポケモン青」をクリア（少しの助けを借りて）

GoogleのAIモデル「Gemini 2.5 Pro」が29年前のゲーム「ポケモン青」をクリア
「Gemini Plays Pokemon」はGoogle非公式の30歳ソフトウェアエンジニアJoel Z氏によるプロジェクト
AIによるゲームプレイ能力の進化を示す一方、完全な自律プレイではなく「エージェントハーネス」などの補助ツールを使用

Googleの高性能AIがゲームをクリア

Googleの最高級AIモデルが大きなマイルストーンを達成したようだ。29年前のビデオゲーム「ポケモン青」をクリアしたのだ。昨夜、GoogleのCEOであるSundar Pichai（スンダー・ピチャイ）氏はXに「なんというフィニッシュだ！Gemini 2.5 Proがポケモン青版をクリアした！」と勝利宣言を投稿した。

What a finish! Gemini 2.5 Pro just completed Pokémon Blue! Special thanks to @TheCodeOfJoel for creating and running the livestream, and to everyone who cheered Gem on along the way. pic.twitter.com/E2pn3tpfEb

— Sundar Pichai (@sundarpichai) May 3, 2025

非公式プロジェクトの背景

明確にしておくと、「Gemini Plays Pokemon」ライブストリームは、本人によれば「Googleと無関係の30歳のソフトウェアエンジニア」である通称Joel Z氏によって作成されたものだ。しかし、Googleの幹部陣はこの取り組みを応援している。例えば、Google AI StudioのプロダクトリードであるLogan Kilpatrick（ローガン・キルパトリック）氏は先月、Geminiが「ポケモンクリアに向けて大きな進展を見せている」「5つ目のバッジを獲得した（次に優れたモデルは、異なるエージェントハーネスを使用しているとはいえ、現時点で3つのみ）」と投稿し、ピチャイ氏は「API、つまりArtificial Pokémon Intelligence（AIポケモン）に取り組んでいる:)」と冗談を飛ばした。

We are working on API, Artificial Pokémon Intelligence:) https://t.co/C11Bf6rAXA

— Sundar Pichai (@sundarpichai) April 19, 2025

なぜポケモンなのか

なぜポケモンなのか？　2月、AnthropicはそのAIモデルClaudeが「ポケモン赤」で達成した進捗を強調し、Claudeの「拡張思考とエージェントトレーニング」が古典的なゲームのプレイのような「より予期せぬ」タスクに「大きなブースト」を与えると述べた（「ポケモン赤版」と「青版」は1996年に初めて発売されたゲームボーイタイトルの異なるバージョンで、長年続くポケモンフランチャイズに関連している）。Joel Z氏がインスピレーションの源として挙げた「Claude Plays Pokemon」というTwitchチャンネルさえ存在する。

AIモデルの比較と補助ツール

その進展にもかかわらず、Claudeはまだ「ポケモン赤」をクリアしていないようだ。これはGeminiがこのゲームにおいて客観的に優れているということを意味するのだろうか？　Joel Z氏はTwitchページで視聴者に「これをLLMがいかにうまくポケモンをプレイできるかのベンチマークとして考えないでほしい。直接比較はできない —GeminiとClaudeは異なるツールを持ち、異なる情報を受け取っている」と訴えた。

そして両方のAIモデルはゲームをプレイするために助けを必要としている —それが前述のエージェントハーネスの役割だ。モデルに追加情報が重ねられたゲームスクリーンショットを提供し、モデルに応答方法を決定させ（専門エージェントを呼び出すことも含む）、そしてAIの指示に対応するボタンを押す仕組みだ。

開発者の介入とその正当性

Joel Z氏はGeminiがゲームを完了するのを助けるための他の「開発者の介入」があったことを認めたが、それはズルではないと主張している。「私の介入はGeminiの全体的な意思決定と推論能力を向上させるものだ」と彼は言う。「具体的なヒントは与えていない —ムーンマウンテンのような特定の課題に対するウォークスルーや直接的な指示はない。唯一それに近いのは、リフトキーを入手するためにロケット団の団員と2回会話する必要があることをGeminiに伝えたことで、これはポケモン・ピカチュウ版（黄版）で後に修正されたバグだった」。

また、彼は「Gemini Plays Pokémonはまだ積極的に開発中であり、フレームワークは進化し続けている」と述べた。

引用元：TechCrunch
Google’s Gemini has beaten Pokémon Blue (with a little help)