返回精选
AI 精选动态 智能评分 66

GRAM 论文

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-21
收录于: 2026-05-21
AI 推荐理由
这篇论文提供了“深度 + 宽度”并行搜索的具体实现方式,以及在 Sudoku、N-Queens 和生成 Sudoku puzzle 上的量化结果,值得关注其 reward predictor 和并行采样设计是否能迁移到其他推理任务。
核心解读
某团队提出 GRAM(Generative Recursive Reasoning),一种带随机性的递归推理模型,声称首次通过在每个 refinement step 注入学习到的随机性,让模型能够并行探索多条 reasoning paths,而不是沿单一确定性轨迹推理。该模型参数量为 10 million,在 hard Sudoku 上准确率达到 97%,优于最佳先前递归模型的 87.4%;在仅 20 个并行 samples 时,其表现超过所有确定性基线,即使这些基线运行到 320 个 recursion steps。
#研究突破#大模型#基准测试