返回精选
AI 精选动态 智能评分 70

来源: twitter关注列表
作者: SemiAnalysis (@SemiAnalysis_)
发布于: 2026-05-17
收录于: 2026-05-17
AI 推荐理由
该技术通过分离核心注意力实现更高效的长序列训练,具备显著的可扩展性,对 AI 基础设施发展具有重要意义。
核心解读
Hao AI Lab 在 UCSD 发布 Core Attention Disaggregation(CAD)技术,通过将核心注意力与线性部分分离,消除长上下文训练中 GPU 工作负载不平衡,实现近线性扩展。
#长上下文#硬件软件协同#注意力机制