AI 精选动态
智能评分 84
Qwen3.7-Max 发布
AI 推荐理由
除了常规基准提升,这次最值得关注的是 35 小时长周期自主执行和跨框架泛化的验证方式,适合关注智能体工作流和代码代理的人直接读原文看评测细节。核心解读
Alibaba 的 Qwen 发布了 Qwen3.7-Max,定位为面向智能体时代的旗舰模型,并已通过 Alibaba Model Studio API 和 Qwen Studio 提供服务。官方称它支持编程智能体、办公与生产力自动化、长周期自主执行和跨框架泛化;其中一项内核优化实验显示,该模型连续 автономously 运行 35 小时,执行了 1,000+ 次工具调用,并在单一 attention kernel 上实现 10x speedup。博客还给出多项基准结果:在 Terminal Bench 2.0、SWE-Verified、SWE-Pro、QwenWebDev、Kernel Bench L3、MMLU-Pro、LiveCodeBench 等任务上与 Opus-4.6、K2.6 Thinking、GLM-5.1 Thinking、DS-V4-Pro Max、Qwen3.6-Plus 等对比,部分指标达到或接近领先。