AI 精选动态
智能评分 65
BioMysteryBench, our new bioinformatics eval, tests whether Claude can devise creative solutions to ...
AI 推荐理由
该基准将 AI 的评估从简单的知识问答提升到了开放式科研问题解决能力,对 AI 在生物医疗领域的实际研究价值具有重要参考意义。核心解读
推出了名为 BioMysteryBench 的生物信息学评估基准,旨在测试 Claude 等模型在面对开放式研究问题时能否制定创造性的解决方案。