返回精选
AI 精选动态 智能评分 67

Anthropic 递归自我改进讨论

来源: twitter关注列表
作者: Chubby♨️ (@kimmonismus)
发布于: 2026-06-04
收录于: 2026-06-04
AI 推荐理由
这条内容的价值在于汇总了 Anthropic 对能力增长、代码贡献占比和任务时长扩展的多组时间序列数据,适合判断其内部 AI 生产力与递归改进叙事是否成立。
核心解读
引用帖概述了 Anthropic 一篇博客的要点:Anthropic 认为,能完全自主设计并构建其后继模型的 AI 已接近出现,但这并非已实现,也并非必然会发生。帖中给出多项进展数据:Anthropic 工程师平均每季度提交的代码量相比 2021–2025 年增长了 8 倍;AI 可可靠完成的任务时长大约每 4 个月翻倍,早先是每 7 个月翻倍。能力轨迹上,Opus 3(2024 年 3 月)约能处理 4 分钟任务,Sonnet 3.7(一年后)约 90 分钟,Opus 4.6(再过一年)达到 12 小时;SWE-bench 在两年内从低个位数到饱和,CORE-bench 在 15 个月内从约 20% 到饱和。另有数据称,截至 2026 年 5 月 Claude 参与了 Anthropic 代码库中 80% 以上的合并代码,2026 年 4 月 Claude 还完成了 800 多个修复,将一类 API 错误减少 1000 倍。
#行业动态#研究#技术