AI 精选动态
智能评分 72
Query-Aware Context Compression for Better Snippets
AI 推荐理由
值得点开原文看其在 RAG 场景中如何同时做到 query-aware、citation-preserving 和高速编排,以及对 SimpleQA 50x 压缩比的实现细节。核心解读
Perplexity 发布并产品化了 query-aware context compression,用于更快、更干净、准确度更高的搜索。其系统可将 context tokens 最多压缩 70%,同时提升答案质量;在 SimpleQA 上达到 50x 压缩比,并保持 frontier-level performance。Perplexity 还表示,该方法是 citation-preserving 的,且速度足以用于 orchestration;在 snippet 级别,vital content 占比提升了 63%,同时在送入 answer model 前会剔除 ads、navigation、metadata 和其他无关内容。