昨日,Mistral 发布了下一代编码模型系列 Devstral 2,提供两种规格:Devstral 2 (123B) 和 Devstral Small 2 (24B)。
Devstral 2 采用修改后的 MIT 许可证,而 Devstral Small 2 使用 Apache 2.0 许可证。两者均为开源软件,并采用宽松的许可协议,旨在加速分布式智能的发展。
Devstral 2 是面向代码代理的 SOTA 开放模型,参数仅为竞争对手的一小部分,在 SWE-bench Verified 测试中取得了72.2%的成绩。在实际任务中成本效益比 Claude Sonnet高出 7 倍。
Devstral:下一代 SOTA 编码
Devstral 2 是一款拥有 1230 亿参数的密集 Transformer 模型,支持 256K 上下文窗口。它在 SWE-bench Verified 测试中取得了72.2%的准确率,使其成为目前最佳的开源权重模型之一,同时保持了极高的成本效益。
Devstral Small 2 在 SWE-bench Verified 测试中获得68.0%的分数,其性能与体积是自身五倍的型号不相上下,同时还能在消费级硬件上本地运行。
Devstral 2 (123B) 和 Devstral Small 2 (24B) 分别比 DeepSeek V3.2 小 5 倍和 28 倍,比 Kimi K2 小 8 倍和 41 倍。这种更小的尺寸使得在硬件资源有限的环境下部署成为可能,降低了开发人员和小型企业的门槛。
Devstral 2 支持浏览代码库并协调跨多个文件的更改,同时保持架构级别的上下文。它跟踪框架依赖关系,检测故障并进行重试以纠正错误,从而解决诸如修复错误和现代化遗留系统等挑战。
Devstral Small 2 是一款拥有240 亿参数的模型,其上下文窗口大小与 Devstral Small 2 相同,并遵循 Apache 2.0 许可协议发布。
其小巧的体积使其能够实现快速推理、紧密的反馈循环和轻松的自定义,并提供完全私有的设备端运行时环境。此外,它还支持图像输入,并可为多模态代理提供支持。
Mistral Vibe CLI
Mistral Vibe CLI 是一款由 Devstral 开发的开源命令行代码助手。它支持使用自然语言在终端中浏览、修改和执行代码库中的更改。它采用 Apache 2.0 许可证发布。
Vibe CLI 提供交互式聊天界面,并配备文件操作、代码搜索、版本控制和命令执行等工具。主要功能有:
项目感知上下文:自动扫描文件结构和 Git 状态,以提供相关上下文
智能引用:使用 @ 自动补全引用文件,使用 ! 执行 shell 命令,以及使用斜杠命令进行配置更改。
多文件编排:它能理解整个代码库,而不仅仅是正在编辑的文件,从而实现架构级推理,将 PR 周期缩短一半。
持久历史记录、自动完成功能和可自定义主题。
可立即使用
Devstral 2 针对数据中心 GPU 进行了优化,部署至少需要4 个 H100 级 GPU。现在即可在 build.nvidia.com 上试用。
Devstral Small 2 专为单 GPU 运行而设计,可在包括 DGX Spark 和 GeForce RTX 在内的多种 NVIDIA 系统上运行。
Devstral Small 既可以在消费级 GPU 上运行,也可以在仅使用 CPU 的配置上运行,无需专用 GPU。
参考资料:
https://mistral.ai/news/devstral-2-vibe-cli
【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/news/1302.html
