高瓴人工智能研究院归档 - 每时AI

嚯！大语言扩散模型来了，何必只预测下一个token 人大高瓴&蚂蚁

下午12时 2025/02/18 作者量子位

人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型，使用扩散模型替代自回归，挑战了大语言模型的固有限制，并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。