AI 精选动态
智能评分 63
Gemini 3.5 Flash ARC-AGI
AI 推荐理由
这条信息的增量在于给出了 ARC-AGI-1/2 的双档成绩与对应成本,并明确对齐到 GPT-5.5 (Medium),适合用来判断模型在推理基准上的性价比。核心解读
ARC Prize 公布了 Gemini 3.5 Flash 在 ARC-AGI 基准上的 verified 成绩,并称其在 ARC-AGI 上与 GPT-5.5 (Medium) 表现相当。ARC-AGI-2 上,High 为 72.1%,成本 $0.85;Minimal 为 8.9%,成本 $0.11。ARC-AGI-1 上,High 为 92.5%,成本 $0.42;Minimal 为 48.8%,成本 $0.06。