AI 精选动态智能评分 67

Anthropic 递归自我改进讨论

来源: twitter关注列表

作者: Chubby♨️ (@kimmonismus)

发布于: 2026-06-04

收录于: 2026-06-04

AI 推荐理由

这条内容的价值在于汇总了 Anthropic 对能力增长、代码贡献占比和任务时长扩展的多组时间序列数据，适合判断其内部 AI 生产力与递归改进叙事是否成立。

核心解读

引用帖概述了 Anthropic 一篇博客的要点：Anthropic 认为，能完全自主设计并构建其后继模型的 AI 已接近出现，但这并非已实现，也并非必然会发生。帖中给出多项进展数据：Anthropic 工程师平均每季度提交的代码量相比 2021–2025 年增长了 8 倍；AI 可可靠完成的任务时长大约每 4 个月翻倍，早先是每 7 个月翻倍。能力轨迹上，Opus 3（2024 年 3 月）约能处理 4 分钟任务，Sonnet 3.7（一年后）约 90 分钟，Opus 4.6（再过一年）达到 12 小时；SWE-bench 在两年内从低个位数到饱和，CORE-bench 在 15 个月内从约 20% 到饱和。另有数据称，截至 2026 年 5 月 Claude 参与了 Anthropic 代码库中 80% 以上的合并代码，2026 年 4 月 Claude 还完成了 800 多个修复，将一类 API 错误减少 1000 倍。

#行业动态#研究#技术

阅读原始全文