AI HOT 日报 (noon)
政策与安全
五角大楼将 Anthropic 替换为其他 AI 供应商
五角大楼宣布,其日常 AI 工作流超过 2/3 已从 Anthropic 迁至其他 AI 供应商,目标 9 月前清零。此前,Anthropic 因拒绝五角大楼要求允许 Claude 用于大规模监控和全自动武器而与政府产生冲突,被列为“供应链风险”。OpenAI 调整立场后获得相关订单,Polymarket 预测 6 月底和解概率为 9%。
模型与基准
Google Gemma:开放式多模态模型系列
Google 发布轻量级开源模型 Gemma(2B-27B参数),支持文本与图像联合处理。模型经 GEMINI-1.5-Pro 精确蒸馏,保留 60% 以上基础模型性能,同时压缩算力消耗,文档理解任务效率提升 20%,提供商业友好的 Apache 2.0 协议授权。
Anthropic Claude Fable 5 登顶 Epoch Capabilities Index
Anthropic 的 Claude Fable 5 在 Epoch Capabilities Index 上获得 161 分,超越 GPT-5.5 Pro 1 分,是 Anthropic 一年多来首次领先该基准;其在软件方面的表现尚无足够数据判断。
新型 AI 模型精准预测蛋白质折叠
一项新的 AI 模型在蛋白质折叠预测方面达到了前所未有的准确性。
开发者工具
Anthropic 调整 Claude Agent SDK/Claude -p 用量规则
从 6 月 15 日起,Claude 将 Agent SDK 和 Claude -p 的用量从 Claude 订阅套餐额度中拆出,两者互不影响。Pro 用户每月获 $20 专用额度,Max 5x 用户获 $100,额度用完才扣其他费用,不滚存。覆盖 Python/TypeScript Agent SDK 项目、Claude Code 的非交互模式及 GitHub Actions 集成。
Vercel 发布 Generative UI Agent Harness
Vercel 推出基于 AI SDK 7 实验 API 的 Generative UI Agent Harness,实现 Claude Code/Codex/Pi 在沙箱中执行真实操作并生成结构化 UI 组件。该工具采用三层解耦架构(HarnessAgent、Sandbox、json-render),前端可实时渲染步骤、diff、终端等组件。
Agentic Code Review 深度分析与策略
Addy Osmani 综合 Faros AI、CodeRabbit、GitClear、GitHub 数据指出,AI 编写代码产出提升 4 倍但交付价值仅 +10%,代码 churn 增 861%,缺陷率升至 54%,零 review 合并 PR 增 31%,review 时长增 441%。提出按爆炸半径、代码寿命、理解者数量决定 review 策略,并给出分层审查体系。
AI 开发者工具升级方案:Seedance V2 免费版及兼容性
引用 Emily 的信息,说明 Seedance V2 的 GitHub 技能提供免费版本,强调其与其他视频模型的良好兼容性。该方案还提及了 Kling 和 Grok Imagine 的未来计划,注重实用价值与技术细节。
产品更新
字节跳动 Seedance 2.0 Mini 发布:价格更低,速度更快
字节跳动推出 Seedance 2.0 Mini,价格比原版便宜约 30%,速度是 Fast 版 2 倍,画质相当。API 定价约 $0.073/秒,30 秒广告成本约 $2.19。支持文生视频和图生视频,可通过 CapCut App、Dreamina 网页端、桌面端使用。限时优惠活动最高可省 55%。