返回精选
AI 精选动态 智能评分 85

LongCat-2.0 正式发布:在国产算力集群上完成全流程训练与推理的万亿参数模型

来源: twitter关注列表
作者: ginobefun (@hongming731)
发布于: 2026-07-01
收录于: 2026-07-02
AI 推荐理由
差异点:首次公开万亿参数MoE在国产算力上的全链路训练数据与性能对比,包括与GPT-5.5和Claude Opus的具体分数差值,以及故障率和MFU提升的量化指标。
核心解读
美团技术团队正式发布LongCat-2.0,万亿参数MoE模型(总参数1.6T,平均激活约48B),在5万卡国产算力集群上完成全流程训练与推理。预训练数据超30T tokens,月均日故障率降低70%以上,训练MFU提升1.5倍。SWE-bench Pro得分59.5,超过GPT-5.5和Claude Opus 4.6。原生支持1M上下文,已跻身OpenRouter全球调用量前三。
全文
BestBlogs 早报 · 07-02 # LongCat-2.0 / 本地 AI / 美图 AI 方法论 / Google ADK 2.0 / Claude Fable 5 [1] ★ 精讲|Ahmad Osman 谈本地 AI 为何正在追赶 https://t.co/DuolSfZeyY 专访 Osmantic 创始人 Ahmad Osman,这位长期倡导本地 AI 的开发者在 AIEWF 办了两场爆满 workshop。他判断开源与闭源前沿模型的差距正持续缩小,目前大约落后 4 到 8 个月。他用朋友买 RTX 5090 跑 Qwen 3.5 改 RGB 灯光失败的例子说明:本地 AI 缺的不是模型,而是搜索、工具、Agent 等完整栈。他从企业主权算力和混合架构角度,讲清了为什么本地 AI 正被认真当作基础设施。 来源:https://t.co/DuolSfZeyY https://t.co/H5MMhY303Z [2] ★ 精讲|美团 LongCat-2.0 正式发布:在国产算力集群上完成全流程训练与推理的万亿参数模型 美团技术团队官方披露 LongCat-2.0 万亿参数 MoE 模型(总参数 1.6T,平均激活约 48B),在 5 万卡国产算力集群上完成全流程训练与推理。预训练数据超 30T tokens,月均日故障率降低 70% 以上,训练 MFU 提升 1.5 倍。SWE-bench Pro 得分 59.5,超过 GPT-5.5 与 Claude Opus 4.6。原生支持 1M 上下文,已跻身 OpenRouter 全球调用量前三。值得读在于,它是少数把国产算力、万亿 MoE、Agentic Coding 全链路讲透的工程实录。 来源:美团 · 技术团队 https://t.co/jkbMe5HX7X [3] ★ 精讲|专访美图 CEO 吴欣鸿:做 AI 产品,是一场难以提前策划的游戏 《智能涌现》专访美图 CEO 吴欣鸿。美图 2025 年营收 38.58 亿元、净利润 9.65 亿元(同比 +64.7%),AI 重构的影像设计收入占比从 35% 升至 76.6%。他立规矩:新产品立项到上线不超 1 个月,半年 ARR 须达 10 万美元,且老产品禁止导流。MVLAND 内测两三个月 ARR 就到 10 万美元、现已近 50 万美元。值得读在于,他用自然生长而非策划、热爱而非纯 PMF 的方法论,讲清了一家 2000 人公司如何在 AI 应用层持续跑赢。 来源:智能涌现 https://t.co/M563jvH4Wi [4] 为什么我们构建了 ADK 2.0 Google ADK 2.0 引入了一个结构化的工作流运行时,将确定性代码执行与 LLM 智能体相结合,解决了生产环境中的可靠性问题,如循环、幻觉和高成本。 来源:Google Developers Blog https://t.co/BghiI4g6FN [5] RAG 的上下文工程:每个 RAG 答案背后的四种类型化输入 本文通过上下文工程的视角重新审视单文档 RAG,展示了如何让管道中的每个组件输出类型化输入,并汇聚成一次可审计且成本高效的 LLM 调用。 来源:Towards Data Science https://t.co/95mGLqoq0U [6] 高德 GrowLoop:构建感性对话的理性 Benchmark 高德团队提出 GrowLoop 系统,通过启发式学习与双循环协进化机制,将感性对话评判标准转化为可生长的理性 Benchmark,解决开放域对话真人感评测难题。 来源:AI 前线 https://t.co/azJUJaM13x [7] 我们团队从 AWS 迁移到 PaaS 的经历 一个 7 人团队量化了 AWS 基础设施维护的隐性成本,在 3 周内迁移到 Sevalla PaaS,并每周节省 10 小时工程师时间。 来源:freeCodeCamp https://t.co/DsNbXIunZT [8] 人类-AI 交互设计的 39 条原则 一个包含 39 条人类-AI 交互设计原则的综合框架,按九个主题组织:概率基础、预期设定、校准信任、透明度、控制、优雅失败、共同创造、负责任自主和持续依赖。 来源:UX Collective https://t.co/Q6cP2nL89q [9] 如何把超级个体的产能,转化成组织能力? | AI 跃迁者调研 本文深度访谈出门问问 CEO 李志飞,揭示从超级个体到超级组织的转型路径:以自研 CodeBanana 系统实现沟通与执行合一,通过全栈转型与系统设计师机制将 AI 产能转化为组织能力。 来源:腾讯研究院 https://t.co/tNFgZIUtD5 [10] AI UITester:AI Native 的 UI 自动化测试新范式|得物技术 本文介绍得物技术团队自研的 AI 原生 UI 测试工具 ai_uitester,通过 VLM 视觉驱动、LLM 用例自动生成和 AI 自愈调试,实现三端统一运维,大幅降低测试维护成本。 来源:得物技术 https://t.co/AS6s49ByjB --- https://t.co/88ZBr47sdT · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你发现真正适合你的高质量内容,欢迎体验。 在线阅读:https://t.co/8QPO8cpIjO > **引用原帖 ginobefun (@hongming731):** > https://t.co/yvBM4Q3akD > https://x.com/hongming731/status/2072461678714011872
#模型发布#技术突破#大模型