AI 精选动态智能评分 65

BioMysteryBench, our new bioinformatics eval, tests whether Claude can devise creative solutions to ...

来源: twitter关注列表

作者: Anthropic (@AnthropicAI)

发布于: 2026-04-29

收录于: 2026-04-29

AI 推荐理由

该基准将 AI 的评估从简单的知识问答提升到了开放式科研问题解决能力，对 AI 在生物医疗领域的实际研究价值具有重要参考意义。

核心解读

推出了名为 BioMysteryBench 的生物信息学评估基准，旨在测试 Claude 等模型在面对开放式研究问题时能否制定创造性的解决方案。

#模型评估#生物信息学#Claude