返回精选
AI 精选动态 智能评分 68

Anthropic Economic Index: New building blocks for understanding AI use

来源: Anthropic-research
发布于: 2026-01-15
收录于: 2026-05-21
AI 推荐理由
这份报告新增了可跨时间跟踪的 5 个经济指标,并给出了 Claude 在复杂度、成功率和任务时长上的量化关系,适合关注 AI 生产力和经济影响的读者直接看原文方法与图表。
核心解读
Anthropic 发布第四份 Economic Index 报告,引入 5 个“economic primitives”来衡量 Claude 的真实使用:任务复杂度、技能水平、用途(工作/教育/个人)、AI 自主性和成功率。报告样本来自 2025 年 11 月的对话,主要使用 Claude Sonnet 4.5;结果显示,在 Claude.ai 上,高中水平任务的提速约 9 倍、大学水平任务约 12 倍,API 上提速更高。按任务成功率看,大学水平任务的成功率为 66%,低于低于高中教育要求任务的 70%;在任务时长上,METR 的基准显示 Claude Sonnet 4.5 在 2 小时任务上成功率为 50%,Anthropic 的 API 数据约为 3.5 小时,Claude.ai 约为 19 小时。
#行业动态#研究突破#大模型