Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

论文提出的新模型ObjectMover结合视频扩散模型和虚幻引擎合成数据,实现了图像中物体的真实感移动。它不仅能处理物体的插入、删除和移动任务,还能有效保持物体的身份特征及光照效果。

生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

浙江大学章国锋教授和商汤科技研究团队提出的StarGen解决了复杂场景的长距离生成一致性问题,通过时空条件结合视频扩散模型实现了高质量、多视一致的生成。

一张图生成高质量广视野3D场景,还可控制摄像轨迹

Wonderland团队首次证明三维重建模型可以有效地建立在扩散模型的潜在空间上,实现高效的三维场景生成。该技术结合视频生成模型和大规模3D重建模型,实现了高效高质量的大规模3D场景生成。