AI HOT 日报 (noon)
商业与人事
Cognition AI 融资超 10 亿美元
Cognition AI CEO Scott Wu 表示,公司旨在将全球 3000 万至 3500 万软件工程师效率提升 10 倍,并催生“10 倍以上”软件需求。公司以 260 亿美元投前估值融资超 10 亿美元,年度经常性收入从 3700 万美元增至约 4.92-5 亿美元,一年内增长超 10 倍。客户包括 Goldman Sachs 和 Mercedes-Benz,核心产品 Devin 定位自主初级工程师,结合自研模型与 OpenAI、Anthropic 模型。
产品更新
OpenAI 强化企业安全与合规
OpenAI 推出 Private MCP Tunnels,允许企业通过单向 HTTPS outbound 连接 ChatGPT、Codex 和 Responses API,无需开放入站端口。同时发布 Workload Identity Federation 和增强 Admin API,支持支出预警、模型白名单、数据保留策略和托管工具控制等企业级管理功能,将 AI 平台升级为企业级基础设施。
Tencent AI 推出 Miora 创意代理工作室
Tencent AI 发布 Miora,一款国际版公测中的 AI creative agent studio,整合图像、视频、UI/UX、3D 生成。支持 agent 自动理解设计上下文、调用工具、进行 inpaint、本地编辑、拆背景并记住用户偏好。内置多种专业 agent,并提供 skills 商店,支持自定义技能与社区分享。
开发者工具
Replit 与 Claude 简化软件开发
Replit 与 Claude 合作,旨在通过集成 AI 能力简化软件开发流程,提升开发者效率。
Cisco 采用 Codex 提升工程效率
Cisco 将 OpenAI Codex 接入生产工程流程,覆盖大规模多仓库 C/C++ 代码库。构建时间下降 20%,每月节省 1,500 多个工程小时;CodeWatch 缺陷修复吞吐提升 10-15 倍;Splunk UI 迁移工作从数周缩短至数天;Defense Squad 从构想到上线用时不足 1 周。
模型发布
某公司发布 700B 参数新模型
某公司发布最新 AI 模型,参数达 700 亿,在性能和数据上与竞争对手有明显差距,标志着行业技术进步。
智能体与平台
AI 系统并行子代理使用率统计
报告显示,当前 AI 系统多数场景仅依赖单一代理,少数场景使用 5 个以上并行代理。研究强调并行策略可提升任务完成效率,但行业普遍仍以单代理为主。
研究突破
护栏复杂度悖论:Harness 冗余降低模型成功率
DAIR.AI 转发研究发现,更强的模型不一定需要更轻量的 harness。一项 432 轮受控实验显示,对于 frontier chat model,增加 harness 冗长度会导致成功率下降 29-38 个百分点,称之为 harness-complexity paradox。
基础设施
Alibaba Cloud 推出 ANOLISA AI 代理专用 OS
Alibaba Cloud 发布 ANOLISA 操作系统,首款专为 AI 代理设计。该系统包含内置技能模块(节省最多 30% token 开销)、双模式 Shell 和 AgentSecCore(操作级沙箱隔离风险),旨在解决传统操作系统成为 AI 代理瓶颈的问题。