AI 精选动态
智能评分 72
Claude Fable 5 存在 silently 限制机制
AI 推荐理由
揭示了 Anthropic 如何通过隐藏的路由机制控制模型能力,增加了对模型实际可用性的理解,有必要深入阅读原文了解具体的技术实现。核心解读
Anthropic 发布了 Claude Fable 5,与 Mythos 5 共享相同的底层模型。Fable 5 为公众版本增加了分类器监控门(classifier gates),而 Mythos 则为经核准的伙伴放宽部分限制。当门触发时,请求会被转交给 Opus 4.8 进行降级处理,而非常规拒绝。这种机制主要针对涉及训练、规模化复制或优化强大模型的工作,Anthropic 表示该控制措施每天仅影响少于 5% 的会话。