返回精选
AI 精选动态 智能评分 78

来源: twitter关注列表
作者: StepFun (@StepFun_ai)
发布于: 2026-05-18
收录于: 2026-05-18
AI 推荐理由
这条信息同时包含模型能力、推理效率、基准结果和实际 agent 产品落地,对关注开源模型选型、agent 框架集成和推理成本控制的从业者很有参考价值。
核心解读
StepFun 将开源基础模型 Step 3.5 Flash 接入 NousResearch 的 Hermes Agent,并在 Nous Portal 上提供免费使用,官方强调其面向 agent 场景,参数规模为 196B 总参数、11B 激活参数,速度可达 100–300 tok/s。配套公开的基准成绩包括 SWE-bench Verified 74.4%、AIME 2025 97.3、Terminal-Bench 2.0 51.0%、GAIA 84.5,说明大模型竞争正在从单纯能力展示转向“可高效执行任务”的 agentic 生产力。
#模型发布#开源#智能体