返回精选
AI 精选动态 智能评分 69

Qwen3.7-Max 登场

来源: twitter关注列表
作者: Qwen (@Alibaba_Qwen)
发布于: 2026-05-21
收录于: 2026-05-21
AI 推荐理由
新增了 1M context window、各项子测试的分项增幅以及 hallucination 与 abstention 的权衡关系,适合用来判断 Alibaba 闭源旗舰的真实进步方向。
核心解读
Artificial Analysis 公布,Alibaba 的 Qwen3.7 Max 在 Artificial Analysis Intelligence Index 上得分 56.6,较 Qwen3.6 Max Preview 的 51.8 提升 4.8 分。该提升主要集中在 scientific reasoning、agentic capability 和 coding:CritPt 从 3.7% 升至 13.4%,HLE 从 28.9% 升至 38.1%,TerminalBench Hard 从 43.9% 升至 50.8%,GDPval-AA 从 1504 提升到 1546 Elo;同时 AA-Omniscience 的 accuracy 从 37.7% 降至 30.1%,hallucination rate 从 44.2% 降至 22.9%。Qwen3.7 Max 使用 96.7M output tokens 跑完该指数,较 Qwen3.6 Max Preview 的 73.9M 增加约 31%;它的 context window 为 1M tokens,较上一代的 256K 提升,模型仍为 proprietary、closed weights,价格尚未公布。
#模型发布#基准测试#大模型