AI 精选动态智能评分 63

WBench 上线 ModelScope

来源: twitter关注列表

作者: ModelScope (@ModelScope2022)

发布于: 2026-05-28

收录于: 2026-05-28

AI 推荐理由

可直接查看榜单与数据集细节，用于对比多轮视频世界模型在导航、编辑和相机切换等任务上的差异。

核心解读

Meituan_LongCat 开发的 WBench 现在已在 ModelScope 上线，用于评测 Interactive Video World Models 的多轮交互能力。该基准覆盖 289 个案例、1,058 轮交互，评估 20 个顶级模型在 5 个核心维度和 22 项指标上的表现，任务包括 Navigation、Subject Action、Event Editing 和 Camera Switching，并对 Video Quality、Consistency（Scene/Interaction）与 Physics 进行严格评测。导航子项的榜单中，Kling 3.0 以 79.2 居首，LingBot-World 以 78.8 位列第二，Wan 2.7 以 78.5 位列第三。

#基准测试#多模态#模型发布

阅读原始全文