AI 精选动态
智能评分 64
Designing AI-resistant technical evaluations
AI 推荐理由
原文除了描述 Anthropic 的招聘测评设计外,还给出了 Claude Opus 4/4.5 对同一测试的实际“攻破”过程,适合关注 AI 时代技术面试与评测设计的人直接看方法细节。核心解读
Anthropic 性能优化团队负责人 Tristan Hume 介绍了他为招聘 performance engineers 设计并重做的 take-home 测试。该测试自 2024 年初开始使用,已有超过 1,000 名候选人完成,招来了几十名工程师,包括参与搭建 Anthropic Trainium 集群并交付自 Claude 3 Opus 以来每个模型的工程师。随着 Claude Opus 4 和 Claude Opus 4.5 先后在相同时间限制下超越大多数人类申请者、甚至匹配最强候选人的表现,团队已迭代到第 3 个版本,并决定把原始 take-home 作为开放挑战发布;文章还说明了该测试的设计目标,以及用 Python 模拟器、Perfetto trace、手动管理 scratchpad memory、VLIW、SIMD 和 multicore 来构建仿真加速器环境。