AI 精选动态智能评分 84

Gemini Omni

来源: twitter关注列表

作者: Demis Hassabis (@demishassabis)

发布于: 2026-05-19

收录于: 2026-05-19

AI 推荐理由

建议重点看官方博客和演示视频，判断其视频编辑能力、跨模态输入输出边界，以及是否已足够成熟进入实际创作流程。

核心解读

Google DeepMind 发布 Gemini Omni，称其为一款“从任意输入生成任意内容”的新模型，首先支持视频输入，并可结合 images、audio、video、text 作为输入生成高质量视频。首发版本 Gemini Omni Flash 已上线 Gemini app、Google Flow 和 YouTube Shorts，后续将支持 image 和 audio 等输出模态。官方表示，用户可以通过自然语言连续编辑视频，模型会保持角色一致性、物理表现和场景记忆，并可基于自有视频反复迭代创意。

#模型发布#产品更新#大模型

阅读原始全文