AI 精选动态
智能评分 75
AI 推荐理由
ProgramBench揭示当前LLM编程能力瓶颈,预示下一代模型将推动AI技术突破,对开发者生态具有重要参考价值。核心解读
ProgramBench基准测试显示当前所有前沿LLM在编程任务中均得分零分,预测下一代模型得分将提升1%,反映AI技术在编程能力上的持续进步。