返回精选
AI 精选动态 智能评分 65

BioMysteryBench, our new bioinformatics eval, tests whether Claude can devise creative solutions to ...

来源: twitter关注列表
作者: Anthropic (@AnthropicAI)
发布于: 2026-04-29
收录于: 2026-04-29
AI 推荐理由
该基准将 AI 的评估从简单的知识问答提升到了开放式科研问题解决能力,对 AI 在生物医疗领域的实际研究价值具有重要参考意义。
核心解读
推出了名为 BioMysteryBench 的生物信息学评估基准,旨在测试 Claude 等模型在面对开放式研究问题时能否制定创造性的解决方案。
#模型评估#生物信息学#Claude