返回精选
AI 精选动态 智能评分 84

Gemini Omni 发布

来源: twitter关注列表
作者: 🚨 AI News | TestingCatalog (@testingcatalog)
发布于: 2026-05-19
收录于: 2026-05-19
AI 推荐理由
这是 Google DeepMind 在视频生成与编辑方向的明确产品化发布,且已给出可用入口和 API 时间表,值得关注其在角色一致性、视频重写和多模态编辑上的实际效果。
核心解读
Google DeepMind 发布 Gemini Omni,称其是首个可“from anything create anything”的视频模型起点,结合了 Gemini 的智能与生成媒体系统,在世界理解、多模态和编辑能力上实现提升。官方还表示,Omni 融合了对物理规律的改进理解,以及 Gemini 对历史、生物和文化的知识,可生成更符合叙事逻辑的视频内容。该模型可在不同场景、动作和光照下保持角色一致性,也能通过输入参考或自然语言应用风格、运动和特效;用户还可以对自己拍摄的视频重新想象动作、改变环境、添加新物体。首个模型 Gemini Omni Flash 已可在 Gemini App、Flow by Google 和 YouTube Shorts 中试用,API 将在接下来的几周内开放。
#模型发布#智能体#产品更新