返回精选
AI 精选动态 智能评分 64

Toy Models of Superposition

来源: Anthropic-research
发布于: 2022-09-14
收录于: 2026-05-21
AI 推荐理由
可用于理解模型内部表征与特征压缩之间的权衡,并为后续机制解释、稀疏特征建模和可解释性研究提供理论切入点。
核心解读
论文使用在合成数据上训练的简化 ReLU 网络研究“superposition”现象,即模型表示的特征数量超过其维度的情况。作者指出,在特征稀疏时,superposition 允许模型实现比线性模型更高的压缩,但代价是会引入需要通过非线性过滤来处理的“interference”。
#研究突破#大模型#技术突破