AI 精选动态
智能评分 76
Gemini 3.5 Flash
AI 推荐理由
原文同时给出多项 agent/coding 基准、速度指标和可用入口,适合判断 Gemini 3.5 Flash 在真实工作流里的位置以及与 Gemini 3.1 Pro 的差距。核心解读
Google DeepMind 发布 Gemini 3.5 系列,并率先推出 3.5 Flash,定位为面向 agent 和 coding 的旗舰级模型。官方称其在多项基准上超过 Gemini 3.1 Pro:Terminal-Bench 2.1 为 76.2%,MCP Atlas 为 83.6%,GDPval-AA 为 1,656 Elo;在多模态理解 CharXiv Reasoning 上达到 84.2%,输出 token 速度则比其他 frontier models 快 4 倍。3.5 Flash 已可在 Gemini app、Google Search 的 AI Mode、Gemini API、Antigravity、Android Studio,以及 Google 的企业 agent 产品中使用;Google 还表示 3.5 Pro 正在内部使用,计划下月发布。