CVPR 2025 HighLight|打通视频到3D的最后一公里,清华团队推出一键式视频扩散模型VideoScene
清华大学研究团队提出VideoScene模型,实现视频到3D场景生成的‘一步式’方法。通过利用3D-aware leap flow distillation策略和动态降噪策略,大幅提升生成效率并保证高质量。
清华大学研究团队提出VideoScene模型,实现视频到3D场景生成的‘一步式’方法。通过利用3D-aware leap flow distillation策略和动态降噪策略,大幅提升生成效率并保证高质量。
加州大学伯克利分校、斯坦福大学和英伟达联合制作的《猫和老鼠》短片背后的研究者介绍了测试时间训练层(TTT)的有效替代方法,用于生成复杂动态故事的长视频。
南洋理工大学 S-Lab 与普渡大学提出 CFG-Zero* 方法,改进 Flow Matching 模型的 Classifier-Free Guidance,提升生成图像/视频的质量和一致性。
港中文联合清华团队发布首个将强化学习范式应用于视频推理的模型Video-R1,该模型通过引入时序建模和混合训练机制,在权威测试中击败了GPT-4o。
ICLR 2025 论文分享会将于4月20日在北京举办,主题包括训练推理、多模态和Agent等。顶尖专家李崇轩将介绍扩散模型在大语言模型范式中的应用,陈键飞则介绍高效训练推理的理论及算法。
Advanced Science青年科学家奖面向全球开放申请,旨在表彰材料科学、化学、物理和工程等领域的年轻科学家。申请条件包括独立PI任职时间不超过10年或45周岁以下,并需提交简历、发表文章清单、推荐信及申请信。申请人须在2025年5月18日前在线提交申请材料。
alphaXiv 推出的新功能「Deep Research for arXiv」协助研究人员更高效地检索和阅读学术论文,显著提升文献研究效率。