o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark 2025-06-16 作者 量子位 大模型O3-Pro成功突破经典游戏推箱子和俄罗斯方块的Benchmark,并展示了其在Lmgame这套测试框架中的表现。