AI 精选动态智能评分 78

Claude Fable5夺冠

来源: twitter关注列表

作者: Nathan Lambert (@natolambert)

发布于: 2026-06-09

收录于: 2026-06-09

AI 推荐理由

在观测性指标上首次突破 50% ，表明工程实用性得到质的飞跃

核心解读

Anthropic 的 Claude Fable 5 在 APEX‑SWE 基准测试中以 65.5% Pass@1 获得点评第一，较 Opus 4.8 提升约 18 个百分点。在观测性指标上，其得分达 69.7%，领先 Opus 4.8 26 个百分点，且为首个突破 50% 观测性阈值的模型。该模型在集成性能上仅为 61.3%，但在观测性上显著高于集成性能，使其成为首个在该维度上得分更高的模型。

#模型发布#技术突破#行业动态

阅读原始全文