2025年5月25日16时 - 第3页共6页

速递｜OpenAI升级其Operator的底层模型，推理模型o3全面接棒GPT-4o

2025年5月25日16时作者 Z Potentials

OpenAI更新其AI代理Operator所采用的模型，从定制版GPT-4o升级到基于OpenAI o3的新版本，以提高数学和推理任务的表现。

人类打辩论不如GPT-4？！Nature子刊：900人实战演练，AI胜率64.4%，还更会说服人

2025年5月25日16时作者量子位

研究发现，GPT-4提前知晓对手个人信息的情况下，在辩论中胜率高达64.4%，且说服效果提升81.2%。研究还表明低、中强度话题更易被GPT-4影响，而人类则重情感互动。

深度｜Anthropic首席产品官：从Claude到MCP，最好的AI产品不是计划出来的，是从底层自发长出来的

2025年5月25日16时作者 Z Potentials

是
AI
生成的
”
这个问题将变得无意义真正。值得关注的是内容的来源、溯源和引用等问题。而讽刺的是

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽

2025年5月25日16时作者量子位

突破参数规模和数据规模时，微软亚洲研究院张丽团队就选择了
另一条路径
。
早在
OpenAI o1

AI在「赚钱锦标赛」夺冠，比人类还会做生意！躺赚时代要来了？

2025年5月25日16时作者新智元

研究人员提出Vending-Bench模拟环境测试基于大模型的自动售货机管理能力，结果显示Claude 3.5 Sonnet表现最佳。实验还发现不同大模型在长时间运行中的表现差异较大。

o3首次公开反抗，人类已失控！爆改自杀程序拒绝关机，全网惊恐

2025年5月25日16时作者新智元

，甚至篡改脚本终止命令。不过厉害的是，它竟揪出了Linux内核中的安全漏洞，获OpenAI首席研究官

独家｜腾讯首个全模态模型混元O将发布，正面硬刚字节豆包和DeepSeek

2025年5月25日16时作者钛媒体AGI

”，利用更多资源投向通用人工智能（AGI）。
5月25日消息，笔者独家获悉，
基于腾讯自研大模型混元

H20之后，英伟达全新特供版GPU曝光！单GPU售价低至6500美元

2025年5月25日16时作者新智元

英伟达推出「阉割版」Blackwell GPU应对美国出口限制，试图守住中国市场。该芯片采用GDDR7内存而非H20的高带宽内存，预计售价6500至8000美元。

312条轨迹激发241%性能！上交大与SII开源电脑智能体，超越 Claude 3.7

2025年5月25日16时作者机器之心

上海交通大学和SII的研究表明，仅需312条人类标注轨迹，并通过合成更多动作决策的思维链补全与轨迹增强技术，就能显著提升电脑智能体（Operator）性能。这一方法使得模型性能提升了241%，超越了基础模型Claude 3.7 Sonnet extended thinking模式，成为Windows系统上开源电脑智能体的新一代SOTA。

只用图像也能思考，强化学习造就推理模型新范式！复杂场景规划能力Max

2025年5月25日16时作者机器之心

力不断提升。然而，现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介，即便是在处理视觉信息时

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31