
人工智能宝可梦终于实现了!谷歌Gemini 2.5 Pro 模型,刚刚成功通关了经典游戏《宝可梦:蓝》
谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 和 DeepMind 负责人戴密斯·哈萨比斯 (Demis Hassabis) 都发文祝贺,感谢了运行这个直播实验的工程师 Joel Z

这事儿怎么来的?
首先得介绍下 Joel Z,他是一位30岁的软件工程师,跟谷歌没直接关系。他搞这个实验,是因为 Gemini 2.5 Pro 出了个实验版,大家就好奇它玩游戏怎么样。于是,就有了这个 “Gemini Plays Pokémon” 直播
这个项目受到了另一个类似项目 “ClaudePlaysPokemon” 的启发。不过 Joel Z 选择了《宝可梦:蓝》,一是因为 Claude 已经在玩《红》了,二是因为《蓝》是他自己玩的第一款宝可梦

Gemini 是怎么玩游戏的?
这才是重点。这个项目不是简单地让 AI 瞎点,而是构建了一套自主决策系统:
连接游戏: 代码通过 Socket 连接到 mGBA 模拟器,能实时截图、发送按键指令(A、B、上、下等),还能读取游戏内存数据,比如玩家位置、宝可梦状态、地图信息等
AI 决策: 系统把带网格线的游戏截图,加上从内存提取的游戏状态信息,发给 Gemini 2.5 Pro。Gemini 分析这些信息,决定下一步操作
专业“外援”: 有时候,Gemini 会把特定任务交给专门的“智能体”(Agent)来处理,以提高效率和可靠性
执行与循环: 系统解析 AI 的指令,转换成具体的按键,发送给模拟器,等游戏画面更新,然后重复这个过程
它和 Claude 玩宝可梦有啥不同?
Joel Z 特别强调,不要把这看作是 LLM 玩宝可梦的基准测试。两者有很多不同:
导航方式: Claude 有个自动导航工具。Gemini 没有,它需要自主决定目的地,然后要么自己规划路线,要么调用一个路径规划智能体(Pathfinder Agent,其实是另一个 Gemini 实例)来寻找最优路径。这个智能体能独立思考,甚至用 BFS(广度优先搜索)这类算法来规划
信息获取: 两者接收到的游戏信息和使用的工具不同
思维模式: 每个模型思考方式不同,各有擅长
所以,别直接比较谁“更强”,不如都看看,感受下不同 AI 的“思路”。Joel Z 也坦言,他觉得 Claude 的框架有些不足,想看看给 Gemini 配上合适的工具后能走多远
关于“作弊”的讨论
直播过程中,有观众注意到 Joel Z 会进行一些干预,还有那个小地图,这算不算“作弊”?
开发者干预: Joel Z 解释说,这不是作弊。项目还在开发阶段,他的干预是为了改进 Gemini 的通用决策和推理能力,而不是给具体关卡的提示(比如没告诉它怎么过月见山)。唯一接近“提示”的是,告知 Gemini 需要和某个火箭队员对话两次才能拿到电梯钥匙,这其实是原版游戏的一个小“坑”,在后续版本修复了。他提到,Claude 项目在直播前也做过类似的幕后优化,Gemini 只是把这个开发过程公开了
小地图: 游戏界面上方那个小地图,是 Gemini 探索区域的可视化。Gemini 本身看不到图像,只接收文本形式的地图信息。Joel Z 认为,人类玩游戏会自然形成心理地图,目前的 LLM 还做不到,小地图是为了弥补这个能力缺陷,并非作弊
限制 Escape Rope / Dig: Gemini 只有在低血量且没有治疗道具时才能使用“穿洞绳”或“挖洞”。这是因为 LLM 还不太擅长判断自己是真卡关了,还是暂时迷路。这个限制强制 Gemini 更多依赖地图记忆和路径规划**,能更清晰地展示其推理过程,避免一遇到困难就“抄近道”
特色“智能体”
除了核心的 Gemini 模型,系统还引入了两个专门的 LLM 智能体:
-
1. 路径规划智能体 (Pathfinder Agent): 如前所述,负责复杂区域(如火箭队基地的旋转地板迷宫)和一般场景的寻路 -
2. 推箱子策略师 (Boulder Puzzle Strategist, BPS): 专门为“冠军之路”的推箱子谜题设计。它能模拟推箱子的序列,找出有效的解法,提高了 Gemini 应对这类挑战的可靠性
内存管理
为了控制输入给模型的 Token 数量,系统大约每 100 次操作就会对消息进行一次总结,用总结替换掉原始消息。
未来计划(暂定)
Joel Z 的想法还包括:
-
• 改进内存管理机制 -
• 让 Gemini 能记笔记,记录重要信息 -
• 给 Gemini 提供更丰富的游戏状态信息(进行中) -
• 探索让观众在不剧透的前提下与 Gemini 互动的方式 -
• 等框架稳定后,进行一次完全无干预的通关尝试 -
• 尝试用其他 LLM(如 Claude 或 o3)进行对比实验
参考:
https://www.twitch.tv/gemini_plays_pokemon
⭐
(文:AI寒武纪)