AI 精选动态
智能评分 60
4B定理证明模型超越DeepSeek
AI 推荐理由
展示了数据效率在定理证明中的巨大潜力,值得关注其开源进展和训练方法。核心解读
Pythagoras-Prover团队发布4B参数定理证明模型,在MiniF2F基准上以86.1% Pass@32超越DeepSeek-Prover-V2-671B,32B版本达89.8% Pass@32和92.6% Pass@2024,为当前最佳结果。模型使用800K Lean验证示例和LoRA训练。