AI 精选动态
智能评分 84
Gemini Omni
AI 推荐理由
建议重点看官方博客和演示视频,判断其视频编辑能力、跨模态输入输出边界,以及是否已足够成熟进入实际创作流程。核心解读
Google DeepMind 发布 Gemini Omni,称其为一款“从任意输入生成任意内容”的新模型,首先支持视频输入,并可结合 images、audio、video、text 作为输入生成高质量视频。首发版本 Gemini Omni Flash 已上线 Gemini app、Google Flow 和 YouTube Shorts,后续将支持 image 和 audio 等输出模态。官方表示,用户可以通过自然语言连续编辑视频,模型会保持角色一致性、物理表现和场景记忆,并可基于自有视频反复迭代创意。