跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
LOO 优势估计
苹果出手!改进GRPO,让dLLM也能高效强化学习
2025年6月27日16时
作者
机器之心
。
不同于基于 Transformer 的自回归式语言模型,dLLM 基于掩码式扩散模型(maske
下载我们的APP,AI秒送达!
立即下载
×