嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁 下午12时 2025/02/18 作者 量子位 人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。