- GoogleのAIモデル「Gemini 2.5 Pro」が29年前のゲーム「ポケモン青」をクリア
- 「Gemini Plays Pokemon」はGoogle非公式の30歳ソフトウェアエンジニアJoel Z氏によるプロジェクト
- AIによるゲームプレイ能力の進化を示す一方、完全な自律プレイではなく「エージェントハーネス」などの補助ツールを使用
Googleの高性能AIがゲームをクリア
Googleの最高級AIモデルが大きなマイルストーンを達成したようだ。29年前のビデオゲーム「ポケモン青」をクリアしたのだ。昨夜、GoogleのCEOであるSundar Pichai(スンダー・ピチャイ)氏はXに「なんというフィニッシュだ!Gemini 2.5 Proがポケモン青版をクリアした!」と勝利宣言を投稿した。
What a finish! Gemini 2.5 Pro just completed Pokémon Blue!  Special thanks to @TheCodeOfJoel for creating and running the livestream, and to everyone who cheered Gem on along the way. pic.twitter.com/E2pn3tpfEb
— Sundar Pichai (@sundarpichai) May 3, 2025
非公式プロジェクトの背景
明確にしておくと、「Gemini Plays Pokemon」ライブストリームは、本人によれば「Googleと無関係の30歳のソフトウェアエンジニア」である通称Joel Z氏によって作成されたものだ。しかし、Googleの幹部陣はこの取り組みを応援している。例えば、Google AI StudioのプロダクトリードであるLogan Kilpatrick(ローガン・キルパトリック)氏は先月、Geminiが「ポケモンクリアに向けて大きな進展を見せている」「5つ目のバッジを獲得した(次に優れたモデルは、異なるエージェントハーネスを使用しているとはいえ、現時点で3つのみ)」と投稿し、ピチャイ氏は「API、つまりArtificial Pokémon Intelligence(AIポケモン)に取り組んでいる:)」と冗談を飛ばした。
We are working on API, Artificial Pokémon Intelligence:) https://t.co/C11Bf6rAXA
— Sundar Pichai (@sundarpichai) April 19, 2025
なぜポケモンなのか
なぜポケモンなのか? 2月、AnthropicはそのAIモデルClaudeが「ポケモン赤」で達成した進捗を強調し、Claudeの「拡張思考とエージェントトレーニング」が古典的なゲームのプレイのような「より予期せぬ」タスクに「大きなブースト」を与えると述べた(「ポケモン赤版」と「青版」は1996年に初めて発売されたゲームボーイタイトルの異なるバージョンで、長年続くポケモンフランチャイズに関連している)。Joel Z氏がインスピレーションの源として挙げた「Claude Plays Pokemon」というTwitchチャンネルさえ存在する。
AIモデルの比較と補助ツール
その進展にもかかわらず、Claudeはまだ「ポケモン赤」をクリアしていないようだ。これはGeminiがこのゲームにおいて客観的に優れているということを意味するのだろうか? Joel Z氏はTwitchページで視聴者に「これをLLMがいかにうまくポケモンをプレイできるかのベンチマークとして考えないでほしい。直接比較はできない —GeminiとClaudeは異なるツールを持ち、異なる情報を受け取っている」と訴えた。
そして両方のAIモデルはゲームをプレイするために助けを必要としている —それが前述のエージェントハーネスの役割だ。モデルに追加情報が重ねられたゲームスクリーンショットを提供し、モデルに応答方法を決定させ(専門エージェントを呼び出すことも含む)、そしてAIの指示に対応するボタンを押す仕組みだ。
開発者の介入とその正当性
Joel Z氏はGeminiがゲームを完了するのを助けるための他の「開発者の介入」があったことを認めたが、それはズルではないと主張している。「私の介入はGeminiの全体的な意思決定と推論能力を向上させるものだ」と彼は言う。「具体的なヒントは与えていない —ムーンマウンテンのような特定の課題に対するウォークスルーや直接的な指示はない。唯一それに近いのは、リフトキーを入手するためにロケット団の団員と2回会話する必要があることをGeminiに伝えたことで、これはポケモン・ピカチュウ版(黄版)で後に修正されたバグだった」。
また、彼は「Gemini Plays Pokémonはまだ積極的に開発中であり、フレームワークは進化し続けている」と述べた。
引用元:TechCrunch
Google’s Gemini has beaten Pokémon Blue (with a little help)