视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

Google DeepMind等机构提出的新视频分层模型无需假设静态背景或精确相机姿态,可分离前景对象和背景,并生成高质量分解结果。该方法利用视频扩散模型及三元掩码技术,增强了遮挡区域补全能力,提升了视频编辑效率和直观性。

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

极佳科技团队通过ReconDreamer实现自动驾驶场景的自由视角重建与生成。该模型仅需单视角输入视频,即可通过世界模型训练减少伪影并进行渐进式修复,显著提升大范围相机运动下的渲染质量,媲美专业三维重建技术。