视频扩散模型归档

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

2025年6月28日16时作者机器之心

ASIC 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏，研究方向聚焦

2025年5月13日23时作者智东西

竟是什么？
智东西5月13日报道，近日，英伟达AI总监兼杰出科学家、Project GR00T（人形

2025年4月14日23时作者机器之心

本文提出了一种高效蒸馏方法AccVideo，通过合成数据集加速视频扩散模型生成速度，相比教师模型（HunyuanVideo）提升了8.5倍的生成速度，并显著减少了推理步骤。

2025年3月29日16时作者机器之心

论文提出的新模型ObjectMover结合视频扩散模型和虚幻引擎合成数据，实现了图像中物体的真实感移动。它不仅能处理物体的插入、删除和移动任务，还能有效保持物体的身份特征及光照效果。

2025年1月16日23时作者机器之心

浙江大学章国锋教授和商汤科技研究团队提出的StarGen解决了复杂场景的长距离生成一致性问题，通过时空条件结合视频扩散模型实现了高质量、多视一致的生成。

2024年12月31日8时作者量子位

Wonderland团队首次证明三维重建模型可以有效地建立在扩散模型的潜在空间上，实现高效的三维场景生成。该技术结合视频生成模型和大规模3D重建模型，实现了高效高质量的大规模3D场景生成。