Llama-3.1-8B 归档 - 每时AI

AI记忆伪装被戳穿！GPT、DeepSeek等17款主流大模型根本记不住数字

2025年6月15日16时作者机器之心

本文介绍了一项研究，发现大多数语言模型缺乏人类的工作记忆能力。通过三组实验测试，表明模型在猜数字、是非问答和数学魔术任务中均无法有效保留信息。

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、近零开销

2024年11月26日13时作者机器之心

机器之心报道
编辑：Panda、杜伟
现在，大语言模型的结构化生成有了一个更加高效、灵活的引擎。
不