AI 精选动态
智能评分 75
Introducing GeneBench-Pro
AI 推荐理由
该benchmark专注于生物数据分析领域的复杂场景,为AI在计算生物学研究中的应用提供了新的评估标准。核心解读
OpenAI 发布 GeneBench-Pro,一个用于评测 AI 代理在复杂生物数据分析中的表现,包括 navigates 生物数据的能力、选择分析路径以及做出计算研究所需判断的benchmark。
全文
We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.
https://openai.com/index/introducing-genebench-pro/