返回日报列表
AI 日报 收录 6 条重要资讯

AI HOT 日报 (evening)

时间范围: 2026年05月26日 04:00 ~ 2026年05月26日 10:00
生成于: 2026年05月26日 10:00
本期导读
本期最重要的是网易有道发布并开源的子曰4全模态模型,以及 Qwen3.7-Max 在 Code Arena 的编程表现与长任务能力。整体看,模型竞争正同时向多模态开源、编程智能体和可验证科学预测基准三条线推进。

模型发布

网易有道发布子曰4

网易有道

网易有道发布子曰4全模态模型,参数规模 27B,在视觉数理方向达到同规模 SOTA,纯文本数理难题准确率为 81.4%。同时开源模型权重与 TTS 引擎;TTS 支持 3 秒克隆原声、14 种语言,克隆准确度超过 97%,音色还原度在 95% 以上。

Qwen3.7-Max 编程模型

Alibaba Cloud

Alibaba Cloud 披露 Qwen3.7-Max 在 Code Arena 得分 1541,位列全球第 2,仅次于 Claude。该模型面向生产场景,支持连续 35 小时任务、1000+ 次工具调用,并被描述为可将原本 2 周的项目压缩到数小时完成。

智能体平台

Qwen3.7-Max 强调长任务

Alibaba Cloud

Alibaba Cloud 进一步强调 Qwen3.7-Max 的智能体能力,核心卖点是连续 35 小时任务稳定执行与 1000+ 次工具调用。相比单纯聊天模型,这次信息更聚焦在可落地的生产级 agent 工作流。

研究突破

科学预测基准 CUSP

hardmaruOxford University

hardmaru 相关研究联合 Oxford University、Stanford University、Allen AI 等团队提出 CUSP 基准,用 4,760 件科学事件评估 AI 的科学预测能力。结果显示,当前最先进模型能识别有前景的研究方向,但难以预测这些方向是否会实现及其时间点,且这种限制不能仅由训练数据量解释。

Sakana AI 跟进 CUSP

Sakana AISakanaAILabs

Sakana AI 转发并确认其研究员山田祐太朗作为共同作者参与了 CUSP 论文,强调团队会继续开发包括 AI Scientist 在内、服务科学研究的 AI。该研究同样基于 4,760 件科学事件,结论是模型能筛选方向,但难以可靠判断成果是否落地及何时落地。

基础设施

Huawei 提出 Tau Scaling

Huawei

Huawei 提出 Tau Scaling / τ Scaling 方法,试图在出口管制和 EUV 工具受限背景下,通过缩短信号传输距离提升芯片性能。方案包含 LogicFolding,原文称 Huawei 已按此思路量产 381 颗芯片,并将高端芯片目标指向 2031 年接近 14Å、约 1.4nm 级密度。

创意产业

AI Key Frames 讨论影视流程

FizzDragonPax Chen

FizzDragon 创始人 Pax Chen 讨论 AI 如何重塑影视、广告和创意制作,重点是从脚本到银幕的流程被持续压缩。该内容偏产业趋势观察,未披露具体模型、产品参数或价格。