AI 精选动态智能评分 70

DiffusionGemma 4‑倍速度但6倍错误

来源: twitter关注列表

作者: Rohan Paul (@rohanpaul_ai)

发布于: 2026-06-12

收录于: 2026-06-12

AI 推荐理由

此基准提供了不同 LLM 推理速度与准确性直接对比的实测数据，可用于评估 DiffusionGemma 在速度与质量折衷下的适用场景。

核心解读

atomic[.]chat 在单一 H100 (FP8) 上基准比较 DiffusionGemma 与 Gemma4 26B A4B。DiffusionGemma 以 763 tok/s、3.7s 总时、33 条正确事实、28 条错误；Gemma4 以 218 tok/s、15.1s 总时、45 条正确事实、5 条错误。DiffusionGemma 在三项任务（Steve Jobs 传记、Tetris 历史、BeOS 故事）中错误率更高，尤其热门度低的主题错误更明显。

#技术#基准测试#模型发布

阅读原始全文