返回精选
AI 精选动态 智能评分 62

来源: twitter关注列表
作者: karminski-牙医 (@karminski3)
发布于: 2026-05-18
收录于: 2026-05-18
AI 推荐理由
这类基准与实测对比能帮助从业者判断新模型在推理、代码与多模态任务上的真实进步,并为选型和产品迭代提供参考。
核心解读
ArenAI(原 LMArena)给 Qwen3.7-Max-Preview 的内测排名第13,作者称其为当前版本国模 SOTA;其中数学能力升至总榜第7,编程第10,视觉第16。文章还通过 three.js 绘图案例指出其在空间理解和指令遵循上较 Qwen3.6-Plus 有明显提升,说明 Qwen 新版本在多模态与复杂指令执行上继续增强。
#模型发布#基准测试#AI模型