AI 精选动态
智能评分 68
AI 推荐理由
首次公开模型内部思维的可解释化方法,对 AI 可解释性和开发者调试具有重要意义。核心解读
Anthropic 发布新研究,将 Claude 模型的内部激活(数值表征)翻译为可读文本,实现自然语言自编码器。