AI 精选动态智能评分 65

Gemini 3.5 Flash 基准分析

来源: twitter关注列表

作者: Berryxia.AI (@berryxia)

发布于: 2026-05-20

收录于: 2026-05-20

AI 推荐理由

可重点看其在智能、速度、幻觉率和价格之间的权衡，以及 1m tokens 上下文与多模态能力是否真的适合现有 agent 工作流。

核心解读

Google 发布了 Gemini 3.5 Flash，Artificial Analysis 对其进行基准评测后给出 Intelligence Index 55 分、Speed 277 tokens/s。它在 agentic 任务 GDPval-AA 上的 Elo 为 1656，幻觉率从 92% 降到 61%，多模态 MMMU-Pro 达到 84%，并支持 text、image、speech、video 输入，输出文本，context window 为 1m tokens。价格为每 1M input tokens $1.50、每 1M output tokens $9，评测 Gemini 3.5 Flash (high) 的总成本为 $1551.60；文中还对比称它在智能、速度和价格上均领先或超过 Gemini 3 Flash、Grok 4.3、Claude Sonnet 4.6 和 Gemini 3.1 Pro，其中运行 Intelligence Index 的成本是 Gemini 3 Flash 的 5.5 倍，比 Gemini 3.1 Pro 贵 75%。

#基准测试#模型发布#大模型

阅读原始全文