大规模语言模型
停止过度思考!一篇关于高效Reasoning的综述来了~
MLNLP社区是国内外知名的人工智能学术社区,其愿景是促进机器学习与自然语言处理领域内的交流合作。论文《Stop Overthinking》探讨了高效推理的方法及其在自动驾驶和医疗诊断等领域的应用挑战,提出模型优化、动态压缩和提示工程三大方向的研究进展及未来展望。
清华大学开源高效的网页爬虫工具,开源的AI创作工作流引擎Refly,手绘示意图详解DeepSeek R1
本文介绍了五个开源项目:Refly用于AI创作,Crawl4LLM用于大规模语言模型预训练的网页爬虫工具,Open Reasoner Zero用于提升大规模推理导向的强化学习训练,SongGen用于文本生成歌曲,Train-DeepSeek-R1通过强化学习提升模型推理能力。