AI 精选动态智能评分 65

New on the Science Blog: We gave Claude 99 problems analyzing real biological data and compared its ...

来源: twitter关注列表

作者: Anthropic (@AnthropicAI)

发布于: 2026-04-29

收录于: 2026-04-29

AI 推荐理由

提供可比较的实测性能数据，明确展示模型在真实科研任务中的突破与局限，对模型选型与研究流程改进具有直接参考价值。

核心解读

研究团队在科学博客发布评估结果：使用真实生物数据对 Claude 进行 99 道问题测试，并与专家小组对比；在专家未能解决的 23 道难题中，最新模型解出约 30%，并完成其余大部分题目。该结果揭示了当前大模型在专业生物数据分析上的能力边界与提升空间。

#模型评估#生物数据#科研应用