重磅发现!大模型的「ahamoment」不是装腔作势,内部信息量暴增数倍! 2025年7月4日14时 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
生成式AI进入第二幕:交大携手创智学院提出「认知工程」,AI新纪元开始了 2025年4月22日16时 作者 机器之心 类或 AI 在各领域的深度认知提炼、结构化并转化为 AI 可学习的形式。 无论你是技术创造者还是使用
375篇文献,深入探究推理大模型后训练技术 2025年3月11日14时 作者 PaperAgent 本文深入探讨了大型语言模型的后训练方法,包括微调、强化学习和测试时扩展等策略。这些技术用于优化LLMs在特定任务上的推理能力,同时讨论了各自的优势与挑战。
仅1k样本超越o1,媲美DeepSeek-R1蒸馏模型,李飞飞新作s1发布 2025年2月6日19时 作者 PaperAgent 一种新的语言建模方法Test-time Scaling通过测试时增加额外计算来提升性能,作者李飞飞等新作S1提出了一种简单而有效的测试时扩展方法,并展示了其实用性。