AI 版《猫和老鼠》刷爆外网!零剪辑自动生成,60 秒神作刷新 AI 视频天花板
伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和老鼠》动画集进行验证,展示了AI在复杂动态场景中的学习与适应能力。
伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和老鼠》动画集进行验证,展示了AI在复杂动态场景中的学习与适应能力。
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。