AI 精选动态智能评分 84

Gemini Omni 发布

来源: twitter关注列表

作者: 🚨 AI News | TestingCatalog (@testingcatalog)

发布于: 2026-05-19

收录于: 2026-05-19

AI 推荐理由

这是 Google DeepMind 在视频生成与编辑方向的明确产品化发布，且已给出可用入口和 API 时间表，值得关注其在角色一致性、视频重写和多模态编辑上的实际效果。

核心解读

Google DeepMind 发布 Gemini Omni，称其是首个可“from anything create anything”的视频模型起点，结合了 Gemini 的智能与生成媒体系统，在世界理解、多模态和编辑能力上实现提升。官方还表示，Omni 融合了对物理规律的改进理解，以及 Gemini 对历史、生物和文化的知识，可生成更符合叙事逻辑的视频内容。该模型可在不同场景、动作和光照下保持角色一致性，也能通过输入参考或自然语言应用风格、运动和特效；用户还可以对自己拍摄的视频重新想象动作、改变环境、添加新物体。首个模型 Gemini Omni Flash 已可在 Gemini App、Flow by Google 和 YouTube Shorts 中试用，API 将在接下来的几周内开放。

#模型发布#智能体#产品更新

阅读原始全文