OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 开云官网

深度赛事分析

OpenAI 于 6 月 27 日正式推出 GPT-5.6 系列模型,但目前尚未全面开放。根据美国政府的要求,该系列模型现阶段仅提供给少数“受信任的合作伙伴”进行预览。

OpenAI 此次发布了三个不同层级的模型:

  • 旗舰版 Sol: 输入费用为每 100 万 Tokens 5 美元(约合人民币 34 元),输出费用为每 100 万 Tokens 30 美元(约合人民币 204.3 元)。
  • 均衡版 Terra: 输入费用为每 100 万 Tokens 2.5 美元(约合人民币 17 元),输出费用为每 100 万 Tokens 15 美元(约合人民币 102.1 元)。
  • Luna: 该模型侧重于速度和成本效益,输入费用为每 100 万 Tokens 1 美元(约合人民币 6.8 元),输出费用为每 100 万 Tokens 6 美元(约合人民币 40.9 元)。

此外,OpenAI 宣布已优化了提示词缓存机制,这将使得在调用过程中重复使用的提示词更加经济且可预测。

在能力方面,OpenAI 表示 GPT-5.6 Sol 是其迄今为止最强大的模型,该模型引入了新的“Max”推理强度,并利用子智能体技术通过“Ultra”模式加速复杂任务的处理。

在编程领域,GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最佳成绩,标准模式下得分 88.8%,超过了 Claude Mythos 5 的 88.0%。当启用 Ultra 模式后,得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中,GPT-5.6 Sol 在消耗更少 token 的情况下,性能表现优于 GPT-5.5。

网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等长链安全任务上展现出显著提升。在 ExploitBench 测试中,该模型仅使用约三分之一的输出 token,便达到了与 Mythos Preview 相近的性能水平。

在安全设计上,OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系,包括模型内置的拒答机制、实时生成过程分类器、账户级别的风险审查、差异化访问控制、监控以及执法机制。对于高风险场景,系统能够暂停生成并由更强大的推理模型进行复核,若判定为违规,内容将在展示前被拦截。

关于上线计划,OpenAI 预计在未来几周内正式发布 GPT-5.6 Sol、Terra 和 Luna。

此外,OpenAI 还计划于 7 月份在 Cerebras 平台上推出 GPT-5.6 Sol,其处理速度最高可达每秒 750 token,初期将仅向特定客户开放。

Prev Post

评论区

赵一 回复
2026年5月18日

在开云体育,我们相信每一次点击都能为您带来价值。我们提供高清流畅的直播体验,让您零延迟感受现场激情,每一次观看都是一次身临其境的享受。

钱二 回复
2026年5月18日

开云体育官网,秉持稳定专业的服务理念,是您值得信赖的体育信息伙伴。我们通过持续优化平台结构和访问体验,确保您能轻松获取所需信息。

发表您的评论