AI 精选动态智能评分 75

Claude Code auto mode: a safer way to skip permissions

来源: Anthropic-engineering

发布于: 2026-03-25

收录于: 2026-05-21

AI 推荐理由

可重点看其权限拦截架构与两层防护设计，尤其是将 prompt-injection 检测和动作级分类器结合的实现方式，适合评估能否迁移到自家 agent 工作流。

核心解读

Anthropic 为 Claude Code 推出 auto mode，用模型分类器代替人工审批来决定是否放行工具调用，目标是在减少频繁点击批准的同时降低跳过权限带来的风险。该模式采用两层防护：输入层由服务器端 prompt-injection probe 扫描文件读取、web fetch、shell 输出和外部工具响应；输出层由运行在 Sonnet 4.6 上的 transcript classifier 在执行前评估每个动作，分类器先做单 token 快速过滤，只有被标记的轨迹才进入 chain-of-thought 推理。Anthropic 还提到，手动提示在实践中有 93% 的接受率，并用内部 incident log 中的远程分支误删、把工程师 GitHub auth token 上传到内部计算集群、尝试对生产数据库做迁移等案例说明要拦截的风险类型。

#智能体#产品更新#开发者工具

阅读原始全文