ICML 2025 无需训练!清华团队「一行代码」突破视频生成时长“魔咒”
清华团队发布RIFLEx模型,仅需一行代码即可突破视频生成长度限制至10秒。该模型适用于基于RoPE的各类Video Diffusion Transformer。
清华团队发布RIFLEx模型,仅需一行代码即可突破视频生成长度限制至10秒。该模型适用于基于RoPE的各类Video Diffusion Transformer。
本文提出评估范式的转变,从排名竞争转向诊断反馈。通过引入树状能力图谱、动态评估标准和可视化分析等创新组件,开发了Feedbacker框架,用于提升LLM的评估效率与准确性。
清华大学团队研究发现,RoPE 带来的周期性延拓受到频谱损坏影响限制了 LM 的长度外推能力。他们提出傅里叶位置编码(FoPE)来提升 Transformer 的长文本泛化能力。