AI 精选动态
智能评分 75
Claude Code auto mode: a safer way to skip permissions
AI 推荐理由
可重点看其权限拦截架构与两层防护设计,尤其是将 prompt-injection 检测和动作级分类器结合的实现方式,适合评估能否迁移到自家 agent 工作流。核心解读
Anthropic 为 Claude Code 推出 auto mode,用模型分类器代替人工审批来决定是否放行工具调用,目标是在减少频繁点击批准的同时降低跳过权限带来的风险。该模式采用两层防护:输入层由服务器端 prompt-injection probe 扫描文件读取、web fetch、shell 输出和外部工具响应;输出层由运行在 Sonnet 4.6 上的 transcript classifier 在执行前评估每个动作,分类器先做单 token 快速过滤,只有被标记的轨迹才进入 chain-of-thought 推理。Anthropic 还提到,手动提示在实践中有 93% 的接受率,并用内部 incident log 中的远程分支误删、把工程师 GitHub auth token 上传到内部计算集群、尝试对生产数据库做迁移等案例说明要拦截的风险类型。