AI玩宝可梦找出30年前代码Bug!谷歌论文介绍AI通关全过程,复杂任务都能解
谷歌发布Gemini 2.5系列大模型技术报告,详细介绍了AI玩《宝可梦》的具体行为。其中特别提到Gemini 2.5 Pro在游戏过程中表现出惊人的创造力和长期规划能力,如飞行技能逃脱困境、为复仇训练特定宝可梦等。同时指出AI存在幻觉问题及思维定势现象。
谷歌发布Gemini 2.5系列大模型技术报告,详细介绍了AI玩《宝可梦》的具体行为。其中特别提到Gemini 2.5 Pro在游戏过程中表现出惊人的创造力和长期规划能力,如飞行技能逃脱困境、为复仇训练特定宝可梦等。同时指出AI存在幻觉问题及思维定势现象。
DeepSeek正式宣布升级模型,性能媲美o3和Gemini 2.5 Pro,成为国内首屈一指的开源模型,并在多项基准测试中表现出色。
DeepSeek 在 Huggingface 平台开源新版本 DeepSeek-R1-0528,主要提升推理精度和代码生成速度。
Perplexity,一家成立三年、融资近9亿美元的AI初创公司,正通过收购困境企业及聘用员工来利用其部分风投资金。
最近,Windsurf发布了其v1.9.0版本,并推出了一系列自研AI模型。其中包括SWE-1、SWE-1-Lite和SWE-1-Mini三个新成员。这些模型旨在提升开发者在软件工程任务中的表现,并展示Windsurf在人工智能技术上的实力。