自我反思
ICLR 2025 Oral LLM也有从众心理!
MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。
Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限
MLNLP社区是国内外知名的人工智能社区,致力于促进学术交流。该领域内的三篇论文讨论了强化学习在大模型训练中的作用,并指出模型的推理能力大部分已在预训练阶段形成,RL更多起到优化选择路径的作用。
Anthropic新模型将“推理模式”与“标准模式”混合:提高数学、物理等方面的表现
Anthropic发布Claude 3.7 Sonnet模型,具备混合模式能力。该模型结合了推理和实时生成答案的功能,并已投入使用。