机器人产业网

OpenAI最新智能编码模型GPT-5.1-Codex-Max:可24小时连续处理百万 Tokens

2025-12-06 10:56:54 浏览:21
导读: 昨日,OpenAI 推出全新的前沿智能编码模型GPT-5.1-Codex-Max。GPT-5.1-Codex-Max 基于 GPT 基础推理模型的升级版构建而成,该模型已在软件工程、数学、研究等领域的智能任务中得到训练。GPT-5.1-Codex-Max 在开发周期的每个阶段在速度、智能水平和代码处...

昨日,OpenAI 推出全新的前沿智能编码模型GPT-5.1-Codex-Max。

GPT-5.1-Codex-Max 基于 GPT 基础推理模型的升级版构建而成,该模型已在软件工程、数学、研究等领域的智能任务中得到训练。

GPT-5.1-Codex-Max 在开发周期的每个阶段在速度、智能水平和代码处理能力上都有所提升。是 OpenAI 首个通过压缩过程进行原生训练 ,能够在多个上下文窗口中运行、在单个任务中连贯地处理数百万个 token 的模型。这意味着,项目规模的重构、深度调试以及长达数小时的代理循环有可能实现

强大的推理能力

GPT-5.1-Codex-Max 经过创建 PR、代码审查、前端编码和问答等真实软件工程任务的训练,在许多前沿编码评估中取得良好成绩。

在实际应用性能中,GPT-5.1-Codex-Max 在 Windows 环境下运行,能够更好地与 Codex CLI 协同工作的任务。

由于推理效率的提高,GPT-5.1-Codex-Max 在token 效率方面表现出显著提升。在 SWE-bench Verified 测试中,GPT-5.1-Codex-Max 在中等推理难度的性能优于 GPT-5.1-Codex,并减少了30%token 的使用量。

对于非延迟敏感型任务,GPT-5.1-Codex-Max 引入了全新的超高(xhigh)推理难度,延长思考时间以获得更优答案。

值得一提的是,GPT-5.1-Codex-Max 性价比高,能够以更低成本生成和 GPT-5.1-Codex 同等质量的前端设计。

可长时间运行

压缩机制使 GPT-5.1-Codex-Max 能够完成以往因上下文窗口限制而失败的任务,例如复杂的重构和长时间运行的代理循环。通过精简历史记录,同时保留上下文信息来实现这一目标。

在 Codex 应用中,当 GPT-5.1-Codex-Max 接近上下文窗口限制时,它会自动压缩会话,获得一个新的上下文窗口,并重复此过程直到任务完成。

官方表示,GPT-5.1-Codex-Max 可以连续独立工作超过24小时,并在这个过程中不断迭代改进,修复失败测试,交付成功结果。

安全又可靠

由于模型能够利用压缩技术在多个上下文窗口中进行连贯的工作,因此在长远编码和网络安全等领域中取得了更好的结果。

GPT-5.1-Codex-Max 是 OpenAI 迄今为止部署最强大的网络安全模型。OpenAI 正在为达到网络安全高能力标准努力,会加强在网络领域的安全防护,同时确保防御者能够通过 Aardvark 等项目收到保护。

在发布 GPT-5-Codex 时,OpenAI 部署了专门针对网络安全的监控系统,以检测和阻止恶意活动。目前尚未发现大规模滥用行为显著增加,所有可疑活动都会被路由到策略监控系统进行审查。

Codex 文件写入仅限于其工作区,网络访问出开发者外默认禁用。为帮助开发人员进行代码审查,Codex 会生成终端日志,并列出其工具调用和测试结果。

GPT-5.1-Codex-Max 与 OpenAI 的 CLI、IDE 扩展、云集成和代码审查工具的持续升级相结合,极大地提升了工程效率。

一则例子现实,OpenAI95%的内部工程师每周都会使用 Codex,这使得他们提交的 pull request 数量增加了约70%。

GPT?5.1-Codex-Max 现已在 Codex 中推出,可用于 CLI、IDE 扩展、云和代码审查,API 访问即将推出。

参考资料:

https://openai.com/index/gpt-5-1-codex-max/

【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/tt/1267.html