AI 精选动态
智能评分 78
Claude Fable5夺冠
AI 推荐理由
在观测性指标上首次突破 50% ,表明工程实用性得到质的飞跃核心解读
Anthropic 的 Claude Fable 5 在 APEX‑SWE 基准测试中以 65.5% Pass@1 获得点评第一,较 Opus 4.8 提升约 18 个百分点。在观测性指标上,其得分达 69.7%,领先 Opus 4.8 26 个百分点,且为首个突破 50% 观测性阈值的模型。该模型在集成性能上仅为 61.3%,但在观测性上显著高于集成性能,使其成为首个在该维度上得分更高的模型。