返回精选
AI 精选动态 智能评分 65

Gemini 3.5 Flash 基准分析

来源: twitter关注列表
作者: Berryxia.AI (@berryxia)
发布于: 2026-05-20
收录于: 2026-05-20
AI 推荐理由
可重点看其在智能、速度、幻觉率和价格之间的权衡,以及 1m tokens 上下文与多模态能力是否真的适合现有 agent 工作流。
核心解读
Google 发布了 Gemini 3.5 Flash,Artificial Analysis 对其进行基准评测后给出 Intelligence Index 55 分、Speed 277 tokens/s。它在 agentic 任务 GDPval-AA 上的 Elo 为 1656,幻觉率从 92% 降到 61%,多模态 MMMU-Pro 达到 84%,并支持 text、image、speech、video 输入,输出文本,context window 为 1m tokens。价格为每 1M input tokens $1.50、每 1M output tokens $9,评测 Gemini 3.5 Flash (high) 的总成本为 $1551.60;文中还对比称它在智能、速度和价格上均领先或超过 Gemini 3 Flash、Grok 4.3、Claude Sonnet 4.6 和 Gemini 3.1 Pro,其中运行 Intelligence Index 的成本是 Gemini 3 Flash 的 5.5 倍,比 Gemini 3.1 Pro 贵 75%。
#基准测试#模型发布#大模型