AI 精选动态智能评分 66

GRAM 论文

来源: twitter关注列表

作者: Rohan Paul (@rohanpaul_ai)

发布于: 2026-05-21

收录于: 2026-05-21

AI 推荐理由

这篇论文提供了“深度 + 宽度”并行搜索的具体实现方式，以及在 Sudoku、N-Queens 和生成 Sudoku puzzle 上的量化结果，值得关注其 reward predictor 和并行采样设计是否能迁移到其他推理任务。

核心解读

某团队提出 GRAM（Generative Recursive Reasoning），一种带随机性的递归推理模型，声称首次通过在每个 refinement step 注入学习到的随机性，让模型能够并行探索多条 reasoning paths，而不是沿单一确定性轨迹推理。该模型参数量为 10 million，在 hard Sudoku 上准确率达到 97%，优于最佳先前递归模型的 87.4%；在仅 20 个并行 samples 时，其表现超过所有确定性基线，即使这些基线运行到 320 个 recursion steps。

#研究突破#大模型#基准测试

阅读原始全文