视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
香港科技大学联合快手可灵团队提出EvoSearch方法,通过演化搜索提升视觉生成模型的性能。该方法无需训练参数,仅需计算资源即可在多个任务上取得显著最优效果,并且具有良好的扩展性和泛化性。
香港科技大学联合快手可灵团队提出EvoSearch方法,通过演化搜索提升视觉生成模型的性能。该方法无需训练参数,仅需计算资源即可在多个任务上取得显著最优效果,并且具有良好的扩展性和泛化性。
机器之心PRO本周解读:自2024年起,Scaling范式开始转移。研究者从”预训练之后,What to Scale Now?”入手,探索新的Scaling目标。TTS(Test-Time Scaling)方法在推理阶段增加计算资源来增强模型性能成为关注热点。
MLNLP社区发布一篇关于Test-Time Scaling(TTS)的survey论文,介绍大语言模型在测试阶段增加计算资源的方法,让模型能够更智能地解答问题。
研究团队首次提出Video-T1方法,通过Test-Time Scaling显著提升视频生成性能,提出Tree-of-Frames方法优化搜索效率和生成质量。
计算机视觉与模式识别会议CVPR将于2025年召开,首届计算机视觉推理扩展研讨会(ViSCALE)将探讨Test-time Scaling在计算机视觉中的应用与发展潜力。