- AI HOT 精选动态

AI 精选动态智能评分 78

来源: twitter关注列表

作者: StepFun (@StepFun_ai)

发布于: 2026-05-18

收录于: 2026-05-18

AI 推荐理由

这条信息同时包含模型能力、推理效率、基准结果和实际 agent 产品落地，对关注开源模型选型、agent 框架集成和推理成本控制的从业者很有参考价值。

核心解读

StepFun 将开源基础模型 Step 3.5 Flash 接入 NousResearch 的 Hermes Agent，并在 Nous Portal 上提供免费使用，官方强调其面向 agent 场景，参数规模为 196B 总参数、11B 激活参数，速度可达 100–300 tok/s。配套公开的基准成绩包括 SWE-bench Verified 74.4%、AIME 2025 97.3、Terminal-Bench 2.0 51.0%、GAIA 84.5，说明大模型竞争正在从单纯能力展示转向“可高效执行任务”的 agentic 生产力。

#模型发布#开源#智能体

阅读原始全文