扩散模型归档 - 第4页共8页

一文搞懂DeepSeek的技术演进之路：大语言模型、视觉语言理解、多模态统一模型

下午11时 2025/02/12 作者极市干货

径比较清晰，意在初步梳理DeepSeek技术的演进及进化之路，主要包括三大方向：大语言模型、视觉语言

下午11时 2025/02/11 作者极市干货

ETok在仅使用128个token的情况下，于256×256和512×512分辨率的ImageNet

下午4时 2025/02/08 作者量子位

来自港中文、北大和上海AI Lab的研究团队将思维链（CoT）与生成模型结合，显著提高了自回归图像生成的质量，并提出了潜力评估奖励模型（PARM）及其增强版本（PARM++），进一步优化了图像生成质量。

下午12时 2025/02/07 作者 HyperAI超神经

究人员，通过深度学习模型 BETE-NET，成功预测了金属的电声相互作用 Eliashberg 谱函

下午11时 2025/02/04 作者 NLP工程化

《Understanding Deep Learning》是一本关于深度学习的专业书籍，涵盖理论基础、性能评估等多个主题，并附有大量练习题。

下午4时 2025/01/27 作者 PaperWeekly

上海交通大学提出SiTo方法，通过基于相似性的令牌剪枝技术，无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。

下午11时 2025/01/22 作者开源AI项目落地

这是一款开源的零样本人像视频动画项目X-Dyna，它能够通过驱动面部表情和身体动作将单张人像图片动画化，并且还能让背景动起来。该技术由扩散模型、动态适配器模块、局部控制模块等组成，能够生成流畅的肢体动作和自然的环境效果。

上午8时 2025/01/21 作者 AIGC开放社区

全球多媒体巨头Adobe联合加州大学发布创新音乐模型DITTO-2，大幅提升生成效率和控制能力。通过模型蒸馏和推理时间优化技术实现高效精准音乐生成。

下午11时 2025/01/20 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨猫先生
来源丨魔方AI空间
编辑丨极市平台
极市导读
本文从强化

下午4时 2025/01/18 作者机器之心

机器之心报道
机器之心编辑部
对于 LLM，推理时 scaling 是有效的！这一点已经被近期的许多