返回精选
AI 精选动态 智能评分 70

DiffusionGemma 4‑倍速度但6倍错误

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-06-12
收录于: 2026-06-12
AI 推荐理由
此基准提供了不同 LLM 推理速度与准确性直接对比的实测数据,可用于评估 DiffusionGemma 在速度与质量折衷下的适用场景。
核心解读
atomic[.]chat 在单一 H100 (FP8) 上基准比较 DiffusionGemma 与 Gemma4 26B A4B。DiffusionGemma 以 763 tok/s、3.7s 总时、33 条正确事实、28 条错误;Gemma4 以 218 tok/s、15.1s 总时、45 条正确事实、5 条错误。DiffusionGemma 在三项任务(Steve Jobs 传记、Tetris 历史、BeOS 故事)中错误率更高,尤其热门度低的主题错误更明显。
#技术#基准测试#模型发布