AI 精选动态
智能评分 78
Introducing Claude Opus 4.8
AI 推荐理由
这是一次带有明确产品与性能更新的模型升级,且同步影响 claude.ai、Claude Code 和定价/加速模式,适合关注 Anthropic 产品路线和 agent 工作流能力的人直接看原文及系统卡。核心解读
Anthropic 将 Claude Opus 升级到 Claude Opus 4.8,称其在各项 benchmark 上较 Opus 4.7 有改进,并在定价上保持不变。claude.ai 新增可调节 Claude 处理任务所投入 effort 的功能,Claude Code 新增 dynamic workflows,可处理更大规模问题;Opus 4.8 的 fast mode 速度为 2.5×,且价格比此前模型便宜 3 倍。Anthropic 还表示,Opus 4.8 在编码、agentic 能力、推理和实用知识工作任务上对比了前代及其他模型,并引用早期测试者反馈称其在更复杂的 agent 任务中更可靠、判断更好;其中部分合作方给出的数据包括 Super-Agent benchmark 上完成全部 case end-to-end、CursorBench 在各 effort level 超越前代、Legal Agent Benchmark 取得最高分且 all-pass 标准首次突破 10%、Online-Mind2Web 得分 84%。