清华&面壁开源新一代主动Agent交互范式!让AI从被命令到主动帮助
清华大学联合面壁智能团队提出新一代主动 Agent 交互范式,让 AI 成为具有’主观能动性’的智能助手。相比传统被动式 Agent,主动 Agent 能够根据上下文主动帮助用户。
大语言模型
清华大学联合面壁智能团队提出新一代主动 Agent 交互范式,让 AI 成为具有’主观能动性’的智能助手。相比传统被动式 Agent,主动 Agent 能够根据上下文主动帮助用户。
木易公众号分享的Kimi新上线数学模型k0-math功能介绍及测试体验,该模型通过强化学习和思维链技术提升复杂问题处理能力,但用户反馈认为其回答过程繁琐冗长,不如其他同类模型简洁直接。
本文揭示了推荐系统流行度偏差放大的原因,提出了一种基于正则项的方法——ReSN来缓解这一问题。通过引入谱范数正则项,约束评分矩阵的权重以减少流行度偏差的影响。
TokenFormer 是一种新的网络结构,通过在注意力机制中引入参数化键值对,实现了模型的灵活扩展和性能提升。它展示了在语言建模和视觉建模上的卓越能力,并提出了专家混合、参数高效微调、端云协同和增强可解释性等未来研究方向。
《Current Best Practices for Training LLMs from Scratch》是一份关于从头开始训练大型语言模型的权威指南,内容涵盖数据收集与处理、模型架构选择、训练技巧与优化策略等各个环节。