推理模型
一道题烧几千美元,OpenAI新模型o3:这34道题我真不会
OpenAI 新模型 o3 在 ARC-AGI 基准测试中取得了显著进步,但仍有部分任务无法解决。o3 能够适应新任务的能力实现了质的飞跃,但仍存在一些局限性。
英伟达B300曝光,性能提升50%、专为o1推理大模型打造
AI芯片系列B300和GB300发布,算力相比前代提升50%,显存从192GB增加到288GB,并且包含多个GB300的计算单元被评价为解决推理大模型内存限制的问题。
又是期货,OpenAI推出全新推理模型o3,实力远超o1
OpenAI在12天直播中推出了新的推理模型o3和o3 Mini,并开放外部安全研究人员进行测试。o3在SWE-Bench Verified测试中的准确率达到71.7%,比前代产品o1高出约20%;数学能力上表现突出,在AIME 2024数学竞赛中得分96.7%。
Google 深夜发布免费版 o1「暴打」OpenAI,实测解题快 3 倍,这句高情商回答绝了
OpenAI 发布全新桌面版 ChatGPT,支持与30多种应用协作提升写作和编程能力。演示中展示了多款应用的交互功能,包括Git命令生成图表、IDE操作等。同时支持Notes、Notion和Quip等多种应用。
OpenAI 年底放大招:12 天连发新品,剑指 10 亿用户
在这个寒冷的十二月,OpenAI CEO Sam Altman启动了为期12天的『OpenAI 12 天』活动,将连续发布新产品和功能演示。这场发布会可能包括备受期待的文本生成视频模型 Sora,并有望带来新的推理模型突破。
阿里Qwen团队发布首个开源推理模型QwQ-32B-preview!
木易分享国内首个开源推理模型QwQ-32B-preview的表现及其在基准测试中的优异成绩,并指出其局限性。该模型由阿里Qwen团队发布,参数仅有32B,适用于多种场景,但仍需优化安全性和连贯性等问题。
OpenAI:2025年ChatGPT将成为“企业大脑”,并向Agent过渡
OpenAI销售总监GC Lionetti预测到2029年通过企业级应用使ChatGPT实现100亿美元收入。OpenAI正转向帮助企业制定战略,专注提升推理模型并准备过渡至自主代理。