AI 精选动态智能评分 70

OpenAI发布GPT-5.6系列模型受限预览

来源: twitter关注列表

作者: 宝玉 (@dotey)

发布于: 2026-06-26

收录于: 2026-06-26

AI 推荐理由

Terra性价比突出，适合高吞吐推理任务；Sol的ultra模式可能简化多agent编排，值得关注后续开放进度。

核心解读

OpenAI发布GPT-5.6系列，包含旗舰版Sol、日常版Terra和经济版Luna，应美国政府要求仅向约20家合作伙伴开放预览。Sol在Terminal-Bench 2.1得分91.9%，超Claude Mythos 5的88%；Terra性能接近GPT-5.5但价格减半，Luna定价最低。OpenAI投入超70万GPU小时进行安全测试，Sol网络安全能力定级为“高”。

全文

OpenAI 今天（6月26日）发布了新一代模型 GPT-5.6，包含三个版本：旗舰级 Sol、日常级 Terra 和经济级 Luna。但这条新闻最值得关注的地方不在模型本身，而在发布方式：应美国政府要求，GPT-5.6 目前只向大约 20 家经过政府审批的合作伙伴开放，普通开发者和 ChatGPT 用户暂时用不上。 GPT-5.6 用了一套新的命名规则：数字代表代际，Sol、Terra、Luna 代表三个固定的能力档位，灵感来自太阳、地球、月亮。Sol 是最强的旗舰，Terra 性能接近上一代 GPT-5.5 但价格砍半，Luna 主打便宜快速。 Sol 新增了两个模式：max 模式让模型花更长时间深度推理，ultra 模式则调用多个子 agent 并行处理复杂任务，相当于一个 AI 自己拆分工作给一组 AI 干活。在 OpenAI 公布的 Terminal-Bench 2.1（测试命令行工作流的编程基准）上，Sol Ultra 得分 91.9%，Sol 为 88.8%，Claude Mythos 5 为 88%，Google Gemini 3.1 Pro Preview 为 70.7%。网络安全方面，Sol 在 ExploitBench 上用大约三分之一的 token 就达到了 Mythos Preview 的水平。 API 定价： Sol 每百万 token 输入 5 美元、输出 30 美元； Terra 分别是 2.5 和 15 美元； Luna 是 1 和 6 美元。 7 月还会上线 Cerebras 硬件加速版本，推理速度可达每秒 750 个 token。 OpenAI 这次花了大量篇幅讲安全。投入超过 70 万 A100 等效 GPU 小时做自动化红队测试，专门寻找能跨场景通用的越狱攻击。模型内置了拒绝机制，实时分类器会在生成过程中检测网络安全和生物领域的滥用行为，可疑输出会被暂停，交给一个更大的推理模型复审。按照 OpenAI 自己的准备框架评估，Sol 的网络安全能力被定级为“高”，但没有达到“关键”级别。它能找到浏览器漏洞和利用原语（exploit primitive，也就是构建攻击的基础组件），但在测试条件下无法自主完成完整的攻击链。 OpenAI 把这解读为一个积极信号：模型更擅长帮防守方找洞和修补，而不是帮攻击方搞破坏。但这个判断是否经得起现实世界的检验，预览期就是用来回答这个问题的。如果你是 API 用户，短期内最实际的变化是：Terra 的性价比。性能接近 GPT-5.5，价格只有一半，对跑大量推理任务的团队来说值得关注。Luna 则适合对成本极度敏感的高吞吐场景。 Sol 的 ultra 模式如果真能稳定运行，意味着复杂的多步骤任务可以甩给模型自己拆解、分配、汇总，开发者不用自己搭 agent 编排框架。这跟 Anthropic 在 Claude 上做的 agent 能力、Cursor 在 IDE 里做的 background agent，方向一致，都在抢占"AI 自己管理 AI"这个位置。但眼下，大多数人还用不上。OpenAI 说几周内会扩大开放，据 Axios 报道下周就会增加更多客户。ChatGPT 用户什么时候能用，还没有明确时间表。完整报告：https://t.co/gHKuwPkbQk ![photo](https://pbs.twimg.com/media/HLw2ZaUWgAA2weF.jpg) > **引用原帖 OpenAI (@OpenAI):** > Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced model for efficient, everyday work, and GPT-5.6 Luna, a fast and affordable model for high-volume work. > https://t.co/OoM83SyISN > https://x.com/OpenAI/status/2070555272230384038

#模型发布#AI#安全

阅读原始全文