AI 精选动态智能评分 68

Qwen-Image-Bench 发布

来源: twitter关注列表

作者: Berryxia.AI (@berryxia)

发布于: 2026-05-28

收录于: 2026-05-28

AI 推荐理由

值得点开原文查看其 56 个细分维度与 Q-Judger 设计，适合直接用于 T2I 模型横评和 prompt 迭代。

核心解读

Qwen 发布了 Qwen-Image-Bench，一个面向 Text-to-Image 的新基准和 Q-Judger 评测模型。该基准包含 1000 条 prompt 和 56 个细粒度 facet，声称与人类对齐度达到 ρ=0.92，并把评测重点从 prompt alignment 扩展到真实世界保真度与创意生成能力。原文称它对 OpenAI、Gemini、Grok、Flux 等现有模型的排序会重新洗牌，且在区分领先模型方面比旧基准更有分离度。

#模型发布#基准测试#多模态

阅读原始全文