AI 精选动态智能评分 73

Step 3.7 Flash

来源: twitter关注列表

作者: AK (@_akhaliq)

发布于: 2026-05-29

收录于: 2026-05-29

AI 推荐理由

这是一个同时给出模型规格、速度、长上下文、工具调用可靠性和多项基准结果的完整发布，适合关注 agent 模型与本地部署能力的读者重点查看。

核心解读

StepFun 发布 Step 3.7 Flash，主打 agent 效率，提供开源权重，采用 Apache 2.0 许可。该模型在 ClawEval-1.1 上得分 67.1、SimpleVQA Search 为 79.2、SWE-PRO 为 56.3、V* Python 为 95.3，并宣称在 τ²-bench 各难度层级均达到 98%+ 的工具调用可靠性。模型规格为 198B sparse MoE、约 11B active，支持 256K 上下文、3 档推理等级，推理速度达到 400 TPS，面向 agentic、coding、search 和 multimodal 工作流，可与 Claude Code、KiloCode、Hermes Agent、OpenClaw 及 MCP 协议配合使用。

#模型发布#智能体#开源

阅读原始全文