AI 精选动态
智能评分 65
Gemini 3.5 Flash 基准分析
AI 推荐理由
可重点看其在智能、速度、幻觉率和价格之间的权衡,以及 1m tokens 上下文与多模态能力是否真的适合现有 agent 工作流。核心解读
Google 发布了 Gemini 3.5 Flash,Artificial Analysis 对其进行基准评测后给出 Intelligence Index 55 分、Speed 277 tokens/s。它在 agentic 任务 GDPval-AA 上的 Elo 为 1656,幻觉率从 92% 降到 61%,多模态 MMMU-Pro 达到 84%,并支持 text、image、speech、video 输入,输出文本,context window 为 1m tokens。价格为每 1M input tokens $1.50、每 1M output tokens $9,评测 Gemini 3.5 Flash (high) 的总成本为 $1551.60;文中还对比称它在智能、速度和价格上均领先或超过 Gemini 3 Flash、Grok 4.3、Claude Sonnet 4.6 和 Gemini 3.1 Pro,其中运行 Intelligence Index 的成本是 Gemini 3 Flash 的 5.5 倍,比 Gemini 3.1 Pro 贵 75%。