Google Gemini、「ポケモン青」をクリア(少しの助けを借りて)

Pokemon

  • GoogleのAIモデル「Gemini 2.5 Pro」が29年前のゲーム「ポケモン青」をクリア
  • 「Gemini Plays Pokemon」はGoogle非公式の30歳ソフトウェアエンジニアJoel Z氏によるプロジェクト
  • AIによるゲームプレイ能力の進化を示す一方、完全な自律プレイではなく「エージェントハーネス」などの補助ツールを使用

Googleの高性能AIがゲームをクリア

Googleの最高級AIモデルが大きなマイルストーンを達成したようだ。29年前のビデオゲーム「ポケモン青」をクリアしたのだ。昨夜、GoogleのCEOであるSundar Pichai(スンダー・ピチャイ)氏はXに「なんというフィニッシュだ!Gemini 2.5 Proがポケモン青版をクリアした!」と勝利宣言を投稿した。

非公式プロジェクトの背景

明確にしておくと、「Gemini Plays Pokemon」ライブストリームは、本人によれば「Googleと無関係の30歳のソフトウェアエンジニア」である通称Joel Z氏によって作成されたものだ。しかし、Googleの幹部陣はこの取り組みを応援している。例えば、Google AI StudioのプロダクトリードであるLogan Kilpatrick(ローガン・キルパトリック)氏は先月、Geminiが「ポケモンクリアに向けて大きな進展を見せている」「5つ目のバッジを獲得した(次に優れたモデルは、異なるエージェントハーネスを使用しているとはいえ、現時点で3つのみ)」と投稿し、ピチャイ氏は「API、つまりArtificial Pokémon Intelligence(AIポケモン)に取り組んでいる:)」と冗談を飛ばした。

なぜポケモンなのか

なぜポケモンなのか? 2月、AnthropicはそのAIモデルClaudeが「ポケモン赤」で達成した進捗を強調し、Claudeの「拡張思考とエージェントトレーニング」が古典的なゲームのプレイのような「より予期せぬ」タスクに「大きなブースト」を与えると述べた(「ポケモン赤版」と「青版」は1996年に初めて発売されたゲームボーイタイトルの異なるバージョンで、長年続くポケモンフランチャイズに関連している)。Joel Z氏がインスピレーションの源として挙げた「Claude Plays Pokemon」というTwitchチャンネルさえ存在する。

AIモデルの比較と補助ツール

その進展にもかかわらず、Claudeはまだ「ポケモン赤」をクリアしていないようだ。これはGeminiがこのゲームにおいて客観的に優れているということを意味するのだろうか? Joel Z氏はTwitchページで視聴者に「これをLLMがいかにうまくポケモンをプレイできるかのベンチマークとして考えないでほしい。直接比較はできない —GeminiとClaudeは異なるツールを持ち、異なる情報を受け取っている」と訴えた。

そして両方のAIモデルはゲームをプレイするために助けを必要としている —それが前述のエージェントハーネスの役割だ。モデルに追加情報が重ねられたゲームスクリーンショットを提供し、モデルに応答方法を決定させ(専門エージェントを呼び出すことも含む)、そしてAIの指示に対応するボタンを押す仕組みだ。

開発者の介入とその正当性

Joel Z氏はGeminiがゲームを完了するのを助けるための他の「開発者の介入」があったことを認めたが、それはズルではないと主張している。「私の介入はGeminiの全体的な意思決定と推論能力を向上させるものだ」と彼は言う。「具体的なヒントは与えていない —ムーンマウンテンのような特定の課題に対するウォークスルーや直接的な指示はない。唯一それに近いのは、リフトキーを入手するためにロケット団の団員と2回会話する必要があることをGeminiに伝えたことで、これはポケモン・ピカチュウ版(黄版)で後に修正されたバグだった」。

また、彼は「Gemini Plays Pokémonはまだ積極的に開発中であり、フレームワークは進化し続けている」と述べた。

引用元:TechCrunch
Google’s Gemini has beaten Pokémon Blue (with a little help)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です