CVPR 2025 双目匹配新突破!DEFOM-Stereo高效利用单目深度基础模型
本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo,该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器,并设计了用于单目视差初始化、尺度更新的方法。实验结果表明,在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。
本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo,该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器,并设计了用于单目视差初始化、尺度更新的方法。实验结果表明,在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。
随着AI技术的发展,程序员职业面临变革。阿里云等公司加强了对Agent体系的接入,并要求后端岗位具备大模型开发能力。但传统技术框架和工具不再成为就业金钥匙,掌握AI大模型原理、应用技术和项目实操经验变得至关重要。
MT-R1-Zero首次将R1-Zero范式扩展到机器翻译领域,通过规则-度量混合奖励机制实现无需监督微调的端到端强化学习优化。该方法在多项指标上超越了现有模型。
该研究提出了一种自动对抗攻击与防御(Auto Adversarial Attack and Defense, A³D)平台,通过自动机器学习技术优化深度神经网络架构和对抗攻击方案,提升模型鲁棒性和安全性。平台支持多种鲁棒性评估方式,并能协同进化以提高整体性能。