返回精选
AI 精选动态 智能评分 75

Claude Code auto mode: a safer way to skip permissions

来源: Anthropic-engineering
发布于: 2026-03-25
收录于: 2026-05-21
AI 推荐理由
可重点看其权限拦截架构与两层防护设计,尤其是将 prompt-injection 检测和动作级分类器结合的实现方式,适合评估能否迁移到自家 agent 工作流。
核心解读
Anthropic 为 Claude Code 推出 auto mode,用模型分类器代替人工审批来决定是否放行工具调用,目标是在减少频繁点击批准的同时降低跳过权限带来的风险。该模式采用两层防护:输入层由服务器端 prompt-injection probe 扫描文件读取、web fetch、shell 输出和外部工具响应;输出层由运行在 Sonnet 4.6 上的 transcript classifier 在执行前评估每个动作,分类器先做单 token 快速过滤,只有被标记的轨迹才进入 chain-of-thought 推理。Anthropic 还提到,手动提示在实践中有 93% 的接受率,并用内部 incident log 中的远程分支误删、把工程师 GitHub auth token 上传到内部计算集群、尝试对生产数据库做迁移等案例说明要拦截的风险类型。
#智能体#产品更新#开发者工具