AI 精选动态智能评分 84

Qwen3.7-Max 发布

来源: twitter关注列表

作者: Chubby♨️ (@kimmonismus)

发布于: 2026-05-21

收录于: 2026-05-21

AI 推荐理由

除了常规基准提升，这次最值得关注的是 35 小时长周期自主执行和跨框架泛化的验证方式，适合关注智能体工作流和代码代理的人直接读原文看评测细节。

核心解读

Alibaba 的 Qwen 发布了 Qwen3.7-Max，定位为面向智能体时代的旗舰模型，并已通过 Alibaba Model Studio API 和 Qwen Studio 提供服务。官方称它支持编程智能体、办公与生产力自动化、长周期自主执行和跨框架泛化；其中一项内核优化实验显示，该模型连续 автономously 运行 35 小时，执行了 1,000+ 次工具调用，并在单一 attention kernel 上实现 10x speedup。博客还给出多项基准结果：在 Terminal Bench 2.0、SWE-Verified、SWE-Pro、QwenWebDev、Kernel Bench L3、MMLU-Pro、LiveCodeBench 等任务上与 Opus-4.6、K2.6 Thinking、GLM-5.1 Thinking、DS-V4-Pro Max、Qwen3.6-Plus 等对比，部分指标达到或接近领先。

#模型发布#智能体#基准测试

阅读原始全文