7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来? 下午4时 2025/04/05 作者 机器之心 型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。 但最近,这种印象正被打破。