AI 精选动态智能评分 75

Anthropic 发布 Claude Sonnet 5，Agent 能力接近 Opus 4.8

来源: twitter关注列表

作者: 宝玉 (@dotey)

发布于: 2026-06-30

收录于: 2026-06-30

AI 推荐理由

Sonnet 5 首次将 Agent 能力提升至接近 Opus 水平，价格仅为 Opus 的 40%，且新分词器可能增加实际成本，开发者需关注推广期后的费用变化。

核心解读

Anthropic 发布 Claude Sonnet 5，替代 Sonnet 4.6 成为免费版和 Pro 版默认模型。Agent 编程基准 Sonnet 5 得分 63.2%，Sonnet 4.6 为 58.1%，Opus 4.8 为 69.2%；知识工作基准 Sonnet 5 甚至略微超过 Opus 4.8。API 推广期价格（8月31日前）为输入 2 美元/百万 Token、输出 10 美元/百万 Token，之后涨至 3 美元和 15 美元，低于 GPT-5.5 和 Gemini 3.1 Pro。新分词器可能导致 token 消耗增加 1.0-1.35 倍，但推广期已对冲。安全方面幻觉率和迎合倾向降低。

全文

Anthropic 今天发布 Claude Sonnet 5，替代 Sonnet 4.6 成为免费版和 Pro 版的默认模型。Anthropic 的定位很明确：Agent 能力接近自家最贵的 Opus 4.8，API 价格只有后者的 40%。 Sonnet 系列是开发者用量最大的一档。但过去几个月，AI Agent 能力（让模型自主规划、调用工具完成多步骤任务）的主要进步集中在更贵的 Opus 系列，两者差距越来越明显。Sonnet 5 把差距缩了回来。在 Agent 编程基准上，Sonnet 5 得分 63.2%，Sonnet 4.6 是 58.1%，Opus 4.8 是 69.2%。在知识工作基准上，Sonnet 5 甚至略微超过了 Opus 4.8。早期测试者的反馈比较一致：以前 Sonnet 做到一半会停的复杂任务，现在能跑完，还会主动检查自己的输出。Zapier 的工程师说，让 Sonnet 5 连续执行“更新 Salesforce 账户等级，再给企业客户发公告邮件”，模型一口气做完了，“以前会卡在半路”。 API 定价分两阶段：8 月 31 日前的推广价是输入 2 美元/百万 Token、输出 10 美元/百万 Token，之后涨到 3 美元和 15 美元。据 TechCrunch 报道，这个价格低于 OpenAI 的 GPT-5.5 和 Google 的 Gemini 3.1 Pro，但仍高于 Gemini 3.5 Flash。有个容易忽略的细节：Sonnet 5 换了新的分词器，同样的文本可能消耗 1.0 到 1.35 倍的 Token。Anthropic 说推广期的定价已经把这个涨幅对冲掉了，过渡期总成本大致不变。但推广价结束后，实际花费会比官方标价的涨幅更大。安全方面，Sonnet 5 的幻觉率和迎合倾向低于前代，Agent 场景下抵御提示注入和恶意请求的能力更强。因为网络安全能力有所提升，模型默认开启了实时安全防护（和 Opus 4.7、4.8 相同的机制）。 Sonnet 5 今天起在 Claude 所有套餐、Claude Code 和 API 上可用，模型代号 claude-sonnet-5。 > **引用原帖 Claude (@claudeai):** > Introducing Claude Sonnet 5, our most agentic Sonnet yet. > It makes plans, uses tools like browsers and terminals, and runs autonomously at a level that just a few months ago required larger and more expensive models. https://t.co/UKK8G7ww5h > https://x.com/claudeai/status/2072017450611142835

#模型发布#大模型#技术更新

阅读原始全文