AI 精选动态
智能评分 67
SenseNova U1 开源
AI 推荐理由
原文同时给出架构改动、权重开放、蒸馏加速和客户端基准对比,适合关注统一多模态路线与图文生成能力的读者直接查看技术报告。核心解读
SenseTime 开源了 SenseNova U1,这是一套统一的多模态模型,能够在单一模型内同时理解、推理并生成图像与文本。该架构去掉了常见的视觉编码器和 VAE 设计,把图像与语言放在共享表示空间中处理;官方还发布了更详细的 Technical Report,并开源了 SenseNova-U1-A3B-MoT 权重(38B-A3B MoE)以及一个 8-step 蒸馏 LoRA,把推理步数从 100 NFE 降到 8 NFE,使 H100 推理时间从 23 秒降到 2 秒。