AI HOT 日报 (evening)
模型发布与更新
GLM-5.2 登顶开源 SOTA,接入 Cola beta
Z.ai (智谱) 发布 GLM-5.2 开源模型 (MIT 许可证),这是首个支持 1M-token 上下文并稳定工作的开源模型,采用 744B/40B MoE 架构。在 Artificial Analysis Intelligence Index v4.1 上获得 51 分,位列全球前三、开源模型榜首(与 Claude Opus 4.8 持平),相比 GLM-5.1 提升 11 点。在 Code Arena 以 Elo 1595 排名第 2,DesignArena 1360 排名第 1,FrontierSWE 排名第 3,Terminal-Bench 2.1 编码测试得分 81.0 (+30点)。其 IndexShare 技术减少计算量 2.9 倍,编程能力达 Opus 水平,已接入 Cola 作为 beta 模型,API 定价 $1.4/$0.26/$4.4 每百万输入/输出/缓存 tokens。
GPT-5 模型技术细节披露
Sam Altman 在与竞争对手公司会议中披露了新版 GPT-5 模型的最新技术细节,强调了模型相较前代在多方面的改进,并提及了此次版本新增的、容量更大的参数量。
Grok Imagine Video 1.5 上线
xAI 发布 Grok Imagine Video 1.5,新模型在视频生成方面具备更自然的物理效果和更快的生成速度,相比上一代模型在质量上有所提升,并通过演示视频展示了其真实场景生成能力。
研究突破
猴子视觉神经元双向语言映射
Surya Ganguli 团队通过构建猴子视觉区域的数字孪生及脑内实验,并结合视觉语言模型,首次实现了从猴子视觉神经元活动到人类语言描述的双向映射。该方法还利用语言条件扩散模型验证,能够从语言生成无限图像以刺激特定神经元。
Claude Code:领域知识重于编程能力
Anthropic 对约 40 万次 Claude Code 会话进行分析,发现交互式编码中领域专业知识对成功率的影响大于编程能力,专家与中等水平用户差距不大,任务价值平均提升约 25%。