返回精选
AI 精选动态 智能评分 76

Gemini 3.5 Flash

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-20
收录于: 2026-05-20
AI 推荐理由
原文同时给出多项 agent/coding 基准、速度指标和可用入口,适合判断 Gemini 3.5 Flash 在真实工作流里的位置以及与 Gemini 3.1 Pro 的差距。
核心解读
Google DeepMind 发布 Gemini 3.5 系列,并率先推出 3.5 Flash,定位为面向 agent 和 coding 的旗舰级模型。官方称其在多项基准上超过 Gemini 3.1 Pro:Terminal-Bench 2.1 为 76.2%,MCP Atlas 为 83.6%,GDPval-AA 为 1,656 Elo;在多模态理解 CharXiv Reasoning 上达到 84.2%,输出 token 速度则比其他 frontier models 快 4 倍。3.5 Flash 已可在 Gemini app、Google Search 的 AI Mode、Gemini API、Antigravity、Android Studio,以及 Google 的企业 agent 产品中使用;Google 还表示 3.5 Pro 正在内部使用,计划下月发布。
#模型发布#智能体#基准测试