OpenAI
刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测
今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,OpenAI自己的模型准确率只有0.6%和0.9%,但最新发布的Agent模型Deep Research准确率达到51.5%,展示了其在自主搜索、信息整合和准确性校准方面的优秀能力。
谷歌牌王炸!Gemini 2.5 Pro深度研究实测:14分钟,34页,15000字研究报告!
谷歌 Gemini 模型更新支持深度研究功能,仅 Advanced 会员可体验。Gemini 2.5 Pro 提供,相比 OpenAI 的 Deep Research 效果更好。Gemini Advanced 用户每月可使用 20 次深度研究。
速递|OpenAI反诉马斯克,营利转型陷司法拉锯战
OpenAI及其联合创始人埃隆·马斯克之间的诉讼未见缓和迹象。马斯克要求停止对OpenAI的攻击,称其行为造成损害,并威胁到OpenAI为使命服务的能力、关键关系及公共利益。
GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」
Alec Radford和Bob McGrew加入新公司Thinking Machine Lab担任顾问,该公司的联合创始人之一Mira Murati计划筹集超过1亿美元资金。Radford是GPT系列模型的重要成员之一,曾在OpenAI工作多年。
全日程揭晓!ICLR 2025论文分享会我们北京见
ICLR 2025 论文分享会将于4月20日在北京举办,主题包括训练推理、多模态和Agent等。顶尖专家李崇轩将介绍扩散模型在大语言模型范式中的应用,陈键飞则介绍高效训练推理的理论及算法。