AI 精选动态
智能评分 70
DiffusionGemma 4‑倍速度但6倍错误
AI 推荐理由
此基准提供了不同 LLM 推理速度与准确性直接对比的实测数据,可用于评估 DiffusionGemma 在速度与质量折衷下的适用场景。核心解读
atomic[.]chat 在单一 H100 (FP8) 上基准比较 DiffusionGemma 与 Gemma4 26B A4B。DiffusionGemma 以 763 tok/s、3.7s 总时、33 条正确事实、28 条错误;Gemma4 以 218 tok/s、15.1s 总时、45 条正确事实、5 条错误。DiffusionGemma 在三项任务(Steve Jobs 传记、Tetris 历史、BeOS 故事)中错误率更高,尤其热门度低的主题错误更明显。