AI 精选动态
智能评分 68
Qwen-Image-Bench 发布
AI 推荐理由
值得点开原文查看其 56 个细分维度与 Q-Judger 设计,适合直接用于 T2I 模型横评和 prompt 迭代。核心解读
Qwen 发布了 Qwen-Image-Bench,一个面向 Text-to-Image 的新基准和 Q-Judger 评测模型。该基准包含 1000 条 prompt 和 56 个细粒度 facet,声称与人类对齐度达到 ρ=0.92,并把评测重点从 prompt alignment 扩展到真实世界保真度与创意生成能力。原文称它对 OpenAI、Gemini、Grok、Flux 等现有模型的排序会重新洗牌,且在区分领先模型方面比旧基准更有分离度。