AI 精选动态智能评分 76

Gemini 3.5 Flash

来源: twitter关注列表

作者: Rohan Paul (@rohanpaul_ai)

发布于: 2026-05-20

收录于: 2026-05-20

AI 推荐理由

原文同时给出多项 agent/coding 基准、速度指标和可用入口，适合判断 Gemini 3.5 Flash 在真实工作流里的位置以及与 Gemini 3.1 Pro 的差距。

核心解读

Google DeepMind 发布 Gemini 3.5 系列，并率先推出 3.5 Flash，定位为面向 agent 和 coding 的旗舰级模型。官方称其在多项基准上超过 Gemini 3.1 Pro：Terminal-Bench 2.1 为 76.2%，MCP Atlas 为 83.6%，GDPval-AA 为 1,656 Elo；在多模态理解 CharXiv Reasoning 上达到 84.2%，输出 token 速度则比其他 frontier models 快 4 倍。3.5 Flash 已可在 Gemini app、Google Search 的 AI Mode、Gemini API、Antigravity、Android Studio，以及 Google 的企业 agent 产品中使用；Google 还表示 3.5 Pro 正在内部使用，计划下月发布。

#模型发布#智能体#基准测试

阅读原始全文