推理模型
又是期货,OpenAI推出全新推理模型o3,实力远超o1
OpenAI在12天直播中推出了新的推理模型o3和o3 Mini,并开放外部安全研究人员进行测试。o3在SWE-Bench Verified测试中的准确率达到71.7%,比前代产品o1高出约20%;数学能力上表现突出,在AIME 2024数学竞赛中得分96.7%。
Google 深夜发布免费版 o1「暴打」OpenAI,实测解题快 3 倍,这句高情商回答绝了
OpenAI 发布全新桌面版 ChatGPT,支持与30多种应用协作提升写作和编程能力。演示中展示了多款应用的交互功能,包括Git命令生成图表、IDE操作等。同时支持Notes、Notion和Quip等多种应用。
OpenAI 年底放大招:12 天连发新品,剑指 10 亿用户
在这个寒冷的十二月,OpenAI CEO Sam Altman启动了为期12天的『OpenAI 12 天』活动,将连续发布新产品和功能演示。这场发布会可能包括备受期待的文本生成视频模型 Sora,并有望带来新的推理模型突破。
阿里Qwen团队发布首个开源推理模型QwQ-32B-preview!
木易分享国内首个开源推理模型QwQ-32B-preview的表现及其在基准测试中的优异成绩,并指出其局限性。该模型由阿里Qwen团队发布,参数仅有32B,适用于多种场景,但仍需优化安全性和连贯性等问题。
OpenAI:2025年ChatGPT将成为“企业大脑”,并向Agent过渡
OpenAI销售总监GC Lionetti预测到2029年通过企业级应用使ChatGPT实现100亿美元收入。OpenAI正转向帮助企业制定战略,专注提升推理模型并准备过渡至自主代理。