ACL2025 LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。最新研究论文探讨了如何解耦语言模型的记忆和推理能力,以实现更可控的大模型。

OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……

文章介绍了Alibaba Cloud的最新模型O3在视觉推理方面的强大能力,包括其识别图片元素、理解并解决实际任务的能力。通过一系列测试题目展示了O3的表现,并对其局限性进行了讨论。

Meta 你摊上事了!Llama 4 vs DeepSeek:谁才是最强开源模型?

Meta 新发布的Llama 4因基准测试成绩亮眼但遭用户质疑,称其实际表现不佳。Meta 因疑似数据污染技术而受到批评。此外,Meta的Llama 4 Maverick模型在多个任务如前端开发、逻辑推理等方面的表现也不尽人意。