昨日,OpenAI 推出全新的前沿智能编码模型GPT-5.1-Codex-Max。
GPT-5.1-Codex-Max 基于 GPT 基础推理模型的升级版构建而成,该模型已在软件工程、数学、研究等领域的智能任务中得到训练。
GPT-5.1-Codex-Max 在开发周期的每个阶段在速度、智能水平和代码处理能力上都有所提升。是 OpenAI 首个通过压缩过程进行原生训练 ,能够在多个上下文窗口中运行、在单个任务中连贯地处理数百万个 token 的模型。这意味着,项目规模的重构、深度调试以及长达数小时的代理循环有可能实现。
强大的推理能力
GPT-5.1-Codex-Max 经过创建 PR、代码审查、前端编码和问答等真实软件工程任务的训练,在许多前沿编码评估中取得良好成绩。
在实际应用性能中,GPT-5.1-Codex-Max 在 Windows 环境下运行,能够更好地与 Codex CLI 协同工作的任务。
由于推理效率的提高,GPT-5.1-Codex-Max 在token 效率方面表现出显著提升。在 SWE-bench Verified 测试中,GPT-5.1-Codex-Max 在中等推理难度的性能优于 GPT-5.1-Codex,并减少了30%token 的使用量。
对于非延迟敏感型任务,GPT-5.1-Codex-Max 引入了全新的超高(xhigh)推理难度,延长思考时间以获得更优答案。
值得一提的是,GPT-5.1-Codex-Max 性价比高,能够以更低成本生成和 GPT-5.1-Codex 同等质量的前端设计。
可长时间运行
压缩机制使 GPT-5.1-Codex-Max 能够完成以往因上下文窗口限制而失败的任务,例如复杂的重构和长时间运行的代理循环。通过精简历史记录,同时保留上下文信息来实现这一目标。
在 Codex 应用中,当 GPT-5.1-Codex-Max 接近上下文窗口限制时,它会自动压缩会话,获得一个新的上下文窗口,并重复此过程直到任务完成。
官方表示,GPT-5.1-Codex-Max 可以连续独立工作超过24小时,并在这个过程中不断迭代改进,修复失败测试,交付成功结果。
安全又可靠
由于模型能够利用压缩技术在多个上下文窗口中进行连贯的工作,因此在长远编码和网络安全等领域中取得了更好的结果。
GPT-5.1-Codex-Max 是 OpenAI 迄今为止部署最强大的网络安全模型。OpenAI 正在为达到网络安全高能力标准努力,会加强在网络领域的安全防护,同时确保防御者能够通过 Aardvark 等项目收到保护。
在发布 GPT-5-Codex 时,OpenAI 部署了专门针对网络安全的监控系统,以检测和阻止恶意活动。目前尚未发现大规模滥用行为显著增加,所有可疑活动都会被路由到策略监控系统进行审查。
Codex 文件写入仅限于其工作区,网络访问出开发者外默认禁用。为帮助开发人员进行代码审查,Codex 会生成终端日志,并列出其工具调用和测试结果。
GPT-5.1-Codex-Max 与 OpenAI 的 CLI、IDE 扩展、云集成和代码审查工具的持续升级相结合,极大地提升了工程效率。
一则例子现实,OpenAI95%的内部工程师每周都会使用 Codex,这使得他们提交的 pull request 数量增加了约70%。
GPT?5.1-Codex-Max 现已在 Codex 中推出,可用于 CLI、IDE 扩展、云和代码审查,API 访问即将推出。
参考资料:
https://openai.com/index/gpt-5-1-codex-max/
【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/tt/1267.html
