Now, Scaling What?
机器之心PRO本周解读:自2024年起,Scaling范式开始转移。研究者从”预训练之后,What to Scale Now?”入手,探索新的Scaling目标。TTS(Test-Time Scaling)方法在推理阶段增加计算资源来增强模型性能成为关注热点。
机器之心PRO本周解读:自2024年起,Scaling范式开始转移。研究者从”预训练之后,What to Scale Now?”入手,探索新的Scaling目标。TTS(Test-Time Scaling)方法在推理阶段增加计算资源来增强模型性能成为关注热点。
本周解读机器之心PRO会员通讯第19期,涵盖2项专题解析及29项AI&Robotics要事速递。重点讨论了Native多模态模型的训练过程差异以及早融合晚融合的优劣。
ICLR拒稿的高分论文因未引用前研究而被接受后引发争议。作者举报该研究存在实验结果矛盾、涉嫌抄袭及不当行为,双方拒绝引用对方。最终论文被选为Spotlight。
智谱推出AI Agent产品‘沉思’,具有深度思考能力。相比Manus更突显模型本身的思考能力,并已在免费上线。张鹏认为预训练仍然重要,未来应用形态会回归到模型上。
ML Summit 2025将于4月18-19日在上海召开,由CSDN & Boolan联合主办,张俊林将分享《从DeepSeek R1的复现看深度思考模型的未来》。