CVPR 2025 Award Candidate 英伟达等Difix3D+:用单步扩散模型修复 3D 重建伪影

研究团队提出了一种创新方案Difix3D+,通过单步扩散模型对3D渲染结果进行‘图像修复’,显著提升新视角图像的质量和一致性。该方法已被CVPR2025接收,并入选最佳论文候选。

监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力

清华大学与英伟达、斯坦福联合提出NFT(Negative-aware FineTuning)方案,通过构造隐式负向模型利用错误数据训练正向模型,使其性能接近强化学习。这一策略弥合了监督学习和强化学习的差距,且损失函数梯度等价于On-Policy条件下的GRPO算法。

沉迷贪吃蛇,7B小模型竟变身「数学天才」!几何推理碾压GPT-4o

新智元报道
莱斯大学、约翰霍普金斯大学以及英伟达的研究人员提出了一种新的AI训练范式ViGaL,通过让7B参数的多模态模型玩简单街机游戏来培养其跨领域的推理能力。研究发现,这种模型不仅在复杂的数学和几何任务上超过了GPT-4o等顶级闭源大模型,还保持了较强的通用视觉能力。