AI 精选动态
智能评分 73
Step 3.7 Flash
AI 推荐理由
这是一个同时给出模型规格、速度、长上下文、工具调用可靠性和多项基准结果的完整发布,适合关注 agent 模型与本地部署能力的读者重点查看。核心解读
StepFun 发布 Step 3.7 Flash,主打 agent 效率,提供开源权重,采用 Apache 2.0 许可。该模型在 ClawEval-1.1 上得分 67.1、SimpleVQA Search 为 79.2、SWE-PRO 为 56.3、V* Python 为 95.3,并宣称在 τ²-bench 各难度层级均达到 98%+ 的工具调用可靠性。模型规格为 198B sparse MoE、约 11B active,支持 256K 上下文、3 档推理等级,推理速度达到 400 TPS,面向 agentic、coding、search 和 multimodal 工作流,可与 Claude Code、KiloCode、Hermes Agent、OpenClaw 及 MCP 协议配合使用。