天塌了!苹果刚刚证明:DeepSeek,o3,Claude等“推理”模型根本没有推理能力

最新研究质疑苹果认为推理模型具备真正逻辑思维能力的观点,指出其在面对复杂问题时表现不佳,并可能陷入性能与思考努力双重崩溃的现象。

ICLR 2025 Oral LLM也有从众心理!

MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。