AI 精选动态智能评分 64

Designing AI-resistant technical evaluations

来源: Anthropic-engineering

发布于: 2026-01-21

收录于: 2026-05-21

AI 推荐理由

原文除了描述 Anthropic 的招聘测评设计外，还给出了 Claude Opus 4/4.5 对同一测试的实际“攻破”过程，适合关注 AI 时代技术面试与评测设计的人直接看方法细节。

核心解读

Anthropic 性能优化团队负责人 Tristan Hume 介绍了他为招聘 performance engineers 设计并重做的 take-home 测试。该测试自 2024 年初开始使用，已有超过 1,000 名候选人完成，招来了几十名工程师，包括参与搭建 Anthropic Trainium 集群并交付自 Claude 3 Opus 以来每个模型的工程师。随着 Claude Opus 4 和 Claude Opus 4.5 先后在相同时间限制下超越大多数人类申请者、甚至匹配最强候选人的表现，团队已迭代到第 3 个版本，并决定把原始 take-home 作为开放挑战发布；文章还说明了该测试的设计目标，以及用 Python 模拟器、Perfetto trace、手动管理 scratchpad memory、VLIW、SIMD 和 multicore 来构建仿真加速器环境。

#行业动态#开发者工具#智能体

阅读原始全文