AI 精选动态
智能评分 78
AI 推荐理由
这条信息同时包含模型能力、推理效率、基准结果和实际 agent 产品落地,对关注开源模型选型、agent 框架集成和推理成本控制的从业者很有参考价值。核心解读
StepFun 将开源基础模型 Step 3.5 Flash 接入 NousResearch 的 Hermes Agent,并在 Nous Portal 上提供免费使用,官方强调其面向 agent 场景,参数规模为 196B 总参数、11B 激活参数,速度可达 100–300 tok/s。配套公开的基准成绩包括 SWE-bench Verified 74.4%、AIME 2025 97.3、Terminal-Bench 2.0 51.0%、GAIA 84.5,说明大模型竞争正在从单纯能力展示转向“可高效执行任务”的 agentic 生产力。