李崇轩归档 - 每时AI

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

2025年6月26日16时作者机器之心

中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队合作研究Diffusion Transformers的超参优化，提出μP理论并将其应用于实际模型训练。通过大规模实验验证了该方法的有效性，并开放论文代码供进一步研究。

2025年6月8日8时作者机器之心

本文介绍的工作基于先前发布的8B扩散语言模型LLaDA，提出了方差缩减的偏好优化方法VRPO，并利用VRPO对LLaDA进行了强化对齐，推出了LLaDA 1.5。该模型在数学、代码和对齐任务上取得了提升，具有竞争力优势。

2025年5月27日16时作者机器之心

本文介绍的研究团队将语言模型 LLaDA 拓展至多模态领域，推出扩散大语言模型 LLaDA-V。该模型在多个基准测试中表现出色，并展示了扩散模型在多模态理解领域的巨大潜力。

2025年4月9日16时作者机器之心

ICLR 2025 论文分享会将于4月20日在北京举办，主题包括训练推理、多模态和Agent等。顶尖专家李崇轩将介绍扩散模型在大语言模型范式中的应用，陈键飞则介绍高效训练推理的理论及算法。