AI 日报收录 6 条重要资讯

AI HOT 日报 (evening)

时间范围: 2026年05月26日 04:00 ~ 2026年05月26日 10:00

生成于: 2026年05月26日 10:00

本期导读

本期最重要的是网易有道发布并开源的子曰4全模态模型，以及 Qwen3.7-Max 在 Code Arena 的编程表现与长任务能力。整体看，模型竞争正同时向多模态开源、编程智能体和可验证科学预测基准三条线推进。

模型发布

网易有道发布子曰4

网易有道

网易有道发布子曰4全模态模型，参数规模 27B，在视觉数理方向达到同规模 SOTA，纯文本数理难题准确率为 81.4%。同时开源模型权重与 TTS 引擎；TTS 支持 3 秒克隆原声、14 种语言，克隆准确度超过 97%，音色还原度在 95% 以上。

Qwen3.7-Max 编程模型

Alibaba Cloud

Alibaba Cloud 披露 Qwen3.7-Max 在 Code Arena 得分 1541，位列全球第 2，仅次于 Claude。该模型面向生产场景，支持连续 35 小时任务、1000+ 次工具调用，并被描述为可将原本 2 周的项目压缩到数小时完成。

智能体平台

Qwen3.7-Max 强调长任务

Alibaba Cloud

Alibaba Cloud 进一步强调 Qwen3.7-Max 的智能体能力，核心卖点是连续 35 小时任务稳定执行与 1000+ 次工具调用。相比单纯聊天模型，这次信息更聚焦在可落地的生产级 agent 工作流。

研究突破

科学预测基准 CUSP

hardmaruOxford University

hardmaru 相关研究联合 Oxford University、Stanford University、Allen AI 等团队提出 CUSP 基准，用 4,760 件科学事件评估 AI 的科学预测能力。结果显示，当前最先进模型能识别有前景的研究方向，但难以预测这些方向是否会实现及其时间点，且这种限制不能仅由训练数据量解释。

Sakana AI 跟进 CUSP

Sakana AISakanaAILabs

Sakana AI 转发并确认其研究员山田祐太朗作为共同作者参与了 CUSP 论文，强调团队会继续开发包括 AI Scientist 在内、服务科学研究的 AI。该研究同样基于 4,760 件科学事件，结论是模型能筛选方向，但难以可靠判断成果是否落地及何时落地。

基础设施

Huawei 提出 Tau Scaling

Huawei

Huawei 提出 Tau Scaling / τ Scaling 方法，试图在出口管制和 EUV 工具受限背景下，通过缩短信号传输距离提升芯片性能。方案包含 LogicFolding，原文称 Huawei 已按此思路量产 381 颗芯片，并将高端芯片目标指向 2031 年接近 14Å、约 1.4nm 级密度。

创意产业

AI Key Frames 讨论影视流程

FizzDragonPax Chen

FizzDragon 创始人 Pax Chen 讨论 AI 如何重塑影视、广告和创意制作，重点是从脚本到银幕的流程被持续压缩。该内容偏产业趋势观察，未披露具体模型、产品参数或价格。