• 登录入口
  • 立即注册

OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 蓝鲸体育官网

在日新月异的数字体育世界里,蓝鲸体育平台始终是体育爱好者获取专业资讯和深度分析的首选。我们致力于为每一位用户打造一个集赛事直播、实时比分、赛程查询及球队动态于一体的综合性数字体育服务平台。

  • 球迷互动专区
蓝鲸体育围绕蓝鲸体育官网不断创新,回应用户的真实需求。 - 蓝鲸体育

OpenAI 于 6 月 27 日正式发布了其最新的 GPT-5.6 系列模型。根据美国政府的要求,目前该系列模型仅对部分“可信合作伙伴”开放预览。

此次发布的模型包含三个版本:

  • 旗舰版 Sol:输入价格为每 100 万 Tokens 5 美元(约合 34 元人民币),输出价格为每 100 万 Tokens 30 美元(约合 204.3 元人民币)。
  • 均衡版 Terra:输入价格为每 100 万 Tokens 2.5 美元(约合 17 元人民币),输出价格为每 100 万 Tokens 15 美元(约合 102.1 元人民币)。
  • Luna:该版本专注于速度和成本,输入价格为每 100 万 Tokens 1 美元(约合 6.8 元人民币),输出价格为每 100 万 Tokens 6 美元(约合 40.9 元人民币)。

OpenAI 还宣布,将优化提示词缓存机制,以降低重复提示词的调用成本并提高可预测性。

在性能方面,GPT-5.6 Sol 被 OpenAI 称为其最强大的模型,引入了新的 Max 推理强度,并支持通过子智能体加速复杂任务的 Ultra 模式。在编程能力测试中,Sol 在 Terminal-Bench 2.1 基准测试上取得了新的领先,标准模式得分 88.8%,优于 Claude Mythos 5 的 88.0%。启用 Ultra 模式后,其得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中,GPT-5.6 Sol 在消耗更少 token 的情况下,表现超越了 GPT-5.5。

网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等长链安全任务上显示出显著的进步。在 ExploitBench 测试中,该模型仅用约三分之一的输出 token 即可达到与 Mythos Preview 相似的性能水平。

在安全设计上,GPT-5.6 Sol、Terra 和 Luna 采用了多层防护措施,包括模型内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问控制以及监控和执法机制。对于高风险场景,系统可以暂停生成并由更强大的推理模型进行复核,若检测到违规,内容将在展示前被拦截。

OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,届时最高可实现每秒 750 token 的处理速度,初期仅面向部分客户提供。

更多精彩内容

蓝鲸体育深耕汇聚全球热门体育赛事,提供权威赛事解读。领域,用心服务每一位用户。