AI 精选动态
智能评分 70
AI 推荐理由
该技术通过分离核心注意力实现更高效的长序列训练,具备显著的可扩展性,对 AI 基础设施发展具有重要意义。核心解读
Hao AI Lab 在 UCSD 发布 Core Attention Disaggregation(CAD)技术,通过将核心注意力与线性部分分离,消除长上下文训练中 GPU 工作负载不平衡,实现近线性扩展。