返回精选
AI 精选动态 智能评分 64

Stable Video Infinity 上线 ModelScope

来源: twitter关注列表
作者: ModelScope (@ModelScope2022)
发布于: 2026-06-04
收录于: 2026-06-04
AI 推荐理由
可重点看其无限长度生成下的长程一致性指标,以及基于少量数据微调 LoRA adapter 的适配方式,适合关注视频生成模型落地与长视频控制能力的人跟进。
核心解读
ModelScope 新增了 Stable Video Infinity,来源为 VITA@EPFL,论文标注为 ICLR 2026 Oral,主打无限长度视频生成,采用 Error Recycling Fine Tuning。原文给出多项指标:SVI-Shot 在一致性视频生成上达到 93.52% 的主体一致性和 95.86% 的背景一致性,对比 FramePack 的 85.62% 主体一致性;在 250 秒时主体一致性为 97.50%,长度扩展时仅下降 0.63%,而 FramePack 下降 13.71%。此外,SVI 的质量指标为 58.07% 审美质量、62.81% 成像质量、98.42% 运动平滑度,并支持每 5 秒 1 条 prompt 的文本流控制,SVI-Talk 和 SVI-Dance 还加入了音频与骨架条件;用户可通过少量数据微调 LoRA adapter 构建面向新视频任务的定制模型。
#视频生成#模型发布#研究突破