LLaDA归档 - 每时AI

大型语言扩散模型

上午8时 2025/02/19 作者 NLP工程化

LLaDA 将扩散模型应用于大规模语言建模，提出了一种新方法解决传统语言模型无法逆向生成内容的问题，并在多个任务上表现出色。

嚯！大语言扩散模型来了，何必只预测下一个token 人大高瓴&蚂蚁

下午12时 2025/02/18 作者量子位

人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型，使用扩散模型替代自回归，挑战了大语言模型的固有限制，并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。