


-
论文标题:VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness -
论文链接:https://arxiv.org/abs/2503.21755 -
视频:https://www.youtube.com/watch?v=kJrzKy9tgAc -
代码:https://github.com/Vchitect/VBench -
网页:https://github.com/Vchitect/VBench-2.0-project
-
Human Fidelity(人体动作与结构)
-
Controllability(可控性)
-
Creativity(创造性)
-
Physics(物理规律)
-
Commonsense(常识推理)
-
分层与解耦的 18 个评测维度
-
开源 Prompt List 体系
-
与人类观感对齐的自动评测
-
多视角观察助力下一代视频生成
-
VBench-1.0:适用于评估视频生成的「表面真实性」,如视觉质量、文本匹配与整体流畅度等。在现阶段为各家模型的进步提供了强力支持。
-
VBench-2.0:在保留 VBench-1.0 优势的同时,进一步聚焦视频的「内在真实性」。当我们想真正判断一个模型有没有「世界模型」,能否用在更深层次的创作和应用场景时,VBench-2.0 的评测就尤为关键。




-
比较天马行空的创意性的生成:Sora -
想要生成人相关的运动镜头:HunyuanVideo 或者 Kling 1.6 -
想要实现精确的相机控制:Kling 1.6 -
想要生成严格遵从文本指示的视频:CogVideoX-1.5 -
想要模拟基础的物理定律:CogVideoX-1.5
-
用提示词或者 In-context 学习的范式来提示 video caption 模型 -
人工添加部分该类型文本数据
©
(文:机器之心)