ICLR 2025 Oral LLM也有从众心理!
MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。
MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。
MLNLP社区是国内外知名的人工智能社区,致力于促进学术交流。该领域内的三篇论文讨论了强化学习在大模型训练中的作用,并指出模型的推理能力大部分已在预训练阶段形成,RL更多起到优化选择路径的作用。
Anthropic发布Claude 3.7 Sonnet模型,具备混合模式能力。该模型结合了推理和实时生成答案的功能,并已投入使用。
国产o1新选手登场,上海AI实验室版o1——书生InternThinker能快速解决数学、代码编程等任务,并能在推理过程中进行自我反思和纠正。其长思维能力提升显著,已在数学、代码及逻辑谜题等多种场景中展现优势。