返回精选
AI 精选动态 智能评分 78

Claude Fable5夺冠

来源: twitter关注列表
作者: Nathan Lambert (@natolambert)
发布于: 2026-06-09
收录于: 2026-06-09
AI 推荐理由
在观测性指标上首次突破 50% ,表明工程实用性得到质的飞跃
核心解读
Anthropic 的 Claude Fable 5 在 APEX‑SWE 基准测试中以 65.5% Pass@1 获得点评第一,较 Opus 4.8 提升约 18 个百分点。在观测性指标上,其得分达 69.7%,领先 Opus 4.8 26 个百分点,且为首个突破 50% 观测性阈值的模型。该模型在集成性能上仅为 61.3%,但在观测性上显著高于集成性能,使其成为首个在该维度上得分更高的模型。
#模型发布#技术突破#行业动态