除了要在基准测试中表现出色,OpenAI这次还藏着一个杀手锏——把开源模型连接到OpenAI的云端模型(cloud-hosted model)上,当开源模型遇到难以处理的复杂问题时,就能调用OpenAI的云端大模型协助完成任务。阿尔特曼将这种功能称为“接力(handoff)”。
通过“云端接力”,开源模型的计算能力实现显著提升。目前还不清楚开源模型是否可以使用OpenAI模型的其他工具,比如网络搜索和图像生成功能。
据消息人士称,“接力”功能的想法由一位开发人员在OpenAI举办的开发者论坛上提出,OpenAI近期一直在收集开发人员社区的反馈意见,以完善其即将发布的开源模型。
OpenAI这一新功能不禁让人联想到苹果智能(Apple Intelligence)。这是苹果公司一系列AI技术和功能的统称,它整合了设备端模型和私有云数据中心的运行模型,可以在用户使用本地模型时,灵活配置和扩充计算资源,调用私有云端模型处理任务。
OpenAI计划推出这项“接力”功能,除了增加收入外,还可以将更多开源社区成员吸引到公司的优质生态系统中来。
目前,关于OpenAI开源模型的“接力”功能如何运作仍有许多未知之处,包括定价和速率限制等。该模型尚处于早期研发阶段,一些功能可能会发生变化,甚至无法实现。
消息人士透露,OpenAI正从零开始训练一个新模型,而非基于现有模型进行改造,预计开放模型的性能会低于OpenAI的o3,但在某些基准测试中会优于DeepSeek的R1推理模型。
就在本周,OpenAI宣布为所有用户开放深度研究(Deep Research)工具的全新“轻量级”版本,它由OpenAI的o4-mini模型提供支持,保留了完整版深度研究的多步骤推理、实时网页浏览、文档解析等核心功能,但响应速度更快、成本更低。
此前,该功能仅对Pro用户开放,它能帮助用户获得多步骤深度分析和结构化报告。如今,免费用户每月可体验5次轻量版深度研究工具,Plus和Team用户每月可以使用25次(含完整版和轻量版),Pro用户则多达每月250次。
OpenAI在X的一系列帖子中表示,轻量版深度搜索回复通常会更短,同时保持用户所期望的深度和质量。一旦达到完整版深度研究的使用次数限制,查询就会自动默认使用轻量版。

▲OpenAI在社交媒体X上发帖介绍深度研究“轻量版”性能
最近,聊天机器人领域涌现出大量深度研究工具,包括谷歌的Gemini、微软的Copilot和xAI的Grok,这些AI推理模型拥有思考问题和自我核实事实的能力,深受专业人士喜爱。
从开源模型的开发布局到深度研究工具的普惠升级,OpenAI一系列动作究竟能否助其稳固AI领域的头部地位,还有待观察。
(文:智东西)