AI 精选动态智能评分 85

LongCat-2.0 正式发布：在国产算力集群上完成全流程训练与推理的万亿参数模型

来源: twitter关注列表

作者: ginobefun (@hongming731)

发布于: 2026-07-01

收录于: 2026-07-02

AI 推荐理由

差异点：首次公开万亿参数MoE在国产算力上的全链路训练数据与性能对比，包括与GPT-5.5和Claude Opus的具体分数差值，以及故障率和MFU提升的量化指标。

核心解读

美团技术团队正式发布LongCat-2.0，万亿参数MoE模型（总参数1.6T，平均激活约48B），在5万卡国产算力集群上完成全流程训练与推理。预训练数据超30T tokens，月均日故障率降低70%以上，训练MFU提升1.5倍。SWE-bench Pro得分59.5，超过GPT-5.5和Claude Opus 4.6。原生支持1M上下文，已跻身OpenRouter全球调用量前三。

全文

BestBlogs 早报 · 07-02 # LongCat-2.0 / 本地 AI / 美图 AI 方法论 / Google ADK 2.0 / Claude Fable 5 [1] ★ 精讲｜Ahmad Osman 谈本地 AI 为何正在追赶 https://t.co/DuolSfZeyY 专访 Osmantic 创始人 Ahmad Osman，这位长期倡导本地 AI 的开发者在 AIEWF 办了两场爆满 workshop。他判断开源与闭源前沿模型的差距正持续缩小，目前大约落后 4 到 8 个月。他用朋友买 RTX 5090 跑 Qwen 3.5 改 RGB 灯光失败的例子说明：本地 AI 缺的不是模型，而是搜索、工具、Agent 等完整栈。他从企业主权算力和混合架构角度，讲清了为什么本地 AI 正被认真当作基础设施。来源：https://t.co/DuolSfZeyY https://t.co/H5MMhY303Z [2] ★ 精讲｜美团 LongCat-2.0 正式发布：在国产算力集群上完成全流程训练与推理的万亿参数模型美团技术团队官方披露 LongCat-2.0 万亿参数 MoE 模型（总参数 1.6T，平均激活约 48B），在 5 万卡国产算力集群上完成全流程训练与推理。预训练数据超 30T tokens，月均日故障率降低 70% 以上，训练 MFU 提升 1.5 倍。SWE-bench Pro 得分 59.5，超过 GPT-5.5 与 Claude Opus 4.6。原生支持 1M 上下文，已跻身 OpenRouter 全球调用量前三。值得读在于，它是少数把国产算力、万亿 MoE、Agentic Coding 全链路讲透的工程实录。来源：美团 · 技术团队 https://t.co/jkbMe5HX7X [3] ★ 精讲｜专访美图 CEO 吴欣鸿：做 AI 产品，是一场难以提前策划的游戏《智能涌现》专访美图 CEO 吴欣鸿。美图 2025 年营收 38.58 亿元、净利润 9.65 亿元（同比 +64.7%），AI 重构的影像设计收入占比从 35% 升至 76.6%。他立规矩：新产品立项到上线不超 1 个月，半年 ARR 须达 10 万美元，且老产品禁止导流。MVLAND 内测两三个月 ARR 就到 10 万美元、现已近 50 万美元。值得读在于，他用自然生长而非策划、热爱而非纯 PMF 的方法论，讲清了一家 2000 人公司如何在 AI 应用层持续跑赢。来源：智能涌现 https://t.co/M563jvH4Wi [4] 为什么我们构建了 ADK 2.0 Google ADK 2.0 引入了一个结构化的工作流运行时，将确定性代码执行与 LLM 智能体相结合，解决了生产环境中的可靠性问题，如循环、幻觉和高成本。来源：Google Developers Blog https://t.co/BghiI4g6FN [5] RAG 的上下文工程：每个 RAG 答案背后的四种类型化输入本文通过上下文工程的视角重新审视单文档 RAG，展示了如何让管道中的每个组件输出类型化输入，并汇聚成一次可审计且成本高效的 LLM 调用。来源：Towards Data Science https://t.co/95mGLqoq0U [6] 高德 GrowLoop：构建感性对话的理性 Benchmark 高德团队提出 GrowLoop 系统，通过启发式学习与双循环协进化机制，将感性对话评判标准转化为可生长的理性 Benchmark，解决开放域对话真人感评测难题。来源：AI 前线 https://t.co/azJUJaM13x [7] 我们团队从 AWS 迁移到 PaaS 的经历一个 7 人团队量化了 AWS 基础设施维护的隐性成本，在 3 周内迁移到 Sevalla PaaS，并每周节省 10 小时工程师时间。来源：freeCodeCamp https://t.co/DsNbXIunZT [8] 人类-AI 交互设计的 39 条原则一个包含 39 条人类-AI 交互设计原则的综合框架，按九个主题组织：概率基础、预期设定、校准信任、透明度、控制、优雅失败、共同创造、负责任自主和持续依赖。来源：UX Collective https://t.co/Q6cP2nL89q [9] 如何把超级个体的产能，转化成组织能力？ | AI 跃迁者调研本文深度访谈出门问问 CEO 李志飞，揭示从超级个体到超级组织的转型路径：以自研 CodeBanana 系统实现沟通与执行合一，通过全栈转型与系统设计师机制将 AI 产能转化为组织能力。来源：腾讯研究院 https://t.co/tNFgZIUtD5 [10] AI UITester：AI Native 的 UI 自动化测试新范式｜得物技术本文介绍得物技术团队自研的 AI 原生 UI 测试工具 ai_uitester，通过 VLM 视觉驱动、LLM 用例自动生成和 AI 自愈调试，实现三端统一运维，大幅降低测试维护成本。来源：得物技术 https://t.co/AS6s49ByjB --- https://t.co/88ZBr47sdT · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你发现真正适合你的高质量内容，欢迎体验。在线阅读：https://t.co/8QPO8cpIjO > **引用原帖 ginobefun (@hongming731):** > https://t.co/yvBM4Q3akD > https://x.com/hongming731/status/2072461678714011872

#模型发布#技术突破#大模型

阅读原始全文