o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低

这篇论文探讨了通过重复采样扩展推理计算量的方法,在多种模型和任务中提高了性能。文章介绍了一种基于无限猴子定理的概念,展示了弱小的模型在大量样本支持下能超越强大的单一模型,并指出覆盖率与样本数之间的近似幂律关系及其成本效益提升。

LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

OpenAI发布强化微调(RFT)API,只需几十个高质量样本即可定制专家模型。相比标准指令调优,RFT通过成千上万epochs让模型学习新行为,稳定性提升。技术实现尚不明确,但已显示出在基础语言模型上的潜力。

AI 独角兽阶跃星辰完成数亿美元融资,国产 AI 六小龙迈入决赛圈

大模型独角兽阶跃星辰完成数亿美元B轮融资,将用于研发基础模型和加强多模态能力,并通过产品生态服务C端用户。公司已发布多个自研基座模型并在多项评测中表现优异。

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA! KDD 2025

DUET创新性地引入了时间维度和通道维度的双向聚类架构,有效解决了多变量时间序列预测中因时序分布漂移导致的时间模式异质性和复杂通道间关系难以动态建模的问题。