新闻中心

一个超强的代码Agent大模型,开源了,本地部署

2025-06-28
浏览次数:
返回列表

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一个超强的代码Agent大模型,开源了,本地部署

大家好,我是 ai 学习的老章

Mistral ai

Mistral AI 是一家位于法国的人工智能初创公司,成立于 2025 年 4 月。由曾在 Google DeepMind 工作的 Arthur Mensch,以及曾在 Meta AI 工作的 Guillaume Lample 和 Timothée Lacroix 共同创立。

Mistral AI 最突出个贡献应该是它 2025 年 12 月发布了全球首个基于 MoE(Mixture of Experts,混合专家)技术的大型语言模型 ——Mistral - 8x7B - MoE,比 DeepSeek 还要早。

今天我们一起看看它最近开源的一个面向软件工程任务的代理型大语言模型——Devstral

mistralai/Devstral-Small-2505

Devstral 擅长使用工具探索代码库、编辑多个文件并为软件工程代理提供支持。

该模型在 SWE-bench 上表现出色,使其成为此基准测试中排名第一的开源模型。

一个超强的代码Agent大模型,开源了,本地部署

Devstral 与在任何框架(包括为模型量身定制的框架)下评估的封闭和开放模型进行了比较,在多项指标上的表现明显优于一些封闭源代码的替代方案。例如,Devstral 在某些方面超越了 GPT-4.1-mini 20%。

一个超强的代码Agent大模型,开源了,本地部署

很讨巧,没有跟大佬们比较,毕竟不是一个量级,不过在开源里算不错了

没有官方数据,貌似 DeepSeek-R1-0528 在 SWE - bench Verified 上得分是 57.6

我稍微查了一下当前最牛逼的模型应该是 Claude Opus 4 和 Sonnet 4,它们在 SWE - Bench 上的分数是 72.5% 和 72.7% 。

官方介绍可以在单个 RTX 4090 或具有 32GB 内存的 Mac 上运行

可能指的是量化版吧

我看了一下 Ollama,4Bit 精度量化模型文件只有 14GB

一个超强的代码Agent大模型,开源了,本地部署https://ollama.com/library/devstral

它部署很简单,不做介绍了 ollama run devstral 即可

下面介绍的是其 fp16 精度版,模型文件 47GB 的样子

CPWEB企业网站管理系统2.2 Beta CPWEB企业网站管理系统2.2 Beta

CPWEB企业网站管理系统(以下称CPWEB)是一个基于PHP+Mysql架构的企业网站管理系统。CPWEB 采用模块化方式开发,功能强大灵活易于扩展,并且完全开放源代码,面向大中型站点提供重量级企业网站建设解决方案。CPWEB企业网站管理系统 2.2 Beta 测试版本,仅供测试,不建议使用在正式项目中,否则发生任何的后果自负。

CPWEB企业网站管理系统2.2 Beta 0 查看详情 CPWEB企业网站管理系统2.2 Beta 下载
一个超强的代码Agent大模型,开源了,本地部署https://modelscope.cn/models/mistralai/Devstral-Small-2505/files
代码语言:bash复制
pip install modelscopemkdir devstral-small-2505cd devstral-small-22505modelscope download mistralai/Devstral-Small-2505 --local_dir .
一个超强的代码Agent大模型,开源了,本地部署
vLLM 部署

47GB 的模型,2 张 4090 估计不够用

直接 4 卡启动

代码语言:bash复制
pip install vllm --upgradecd devstral-small-22505CUDA_VIDIBLE_DEVICES=1,2,3,4 vllm serve . --served-model-name Devstral-Small-2505 --tensor-parallel-size 4 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 4

启动成功之后就可以把 api 接入 chatbot 或 ide 中使用了

测试情况,后续更新

其实是我的卡不够用了,目前在跑的 Qwen3:32B 和 DeepSeek-R1-0528-Qwen3-8B 都正在用,等空闲了再测试吧。

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个?,谢谢你看我的文章,我们下篇再见!

搭建完美的写作环境:工具篇(12 章)

图解机器学习 - 中文版(72 张 PNG)

ChatGPT、大模型系列研究报告(50 个 PDF)

108 页 PDF 小册子:搭建机器学习开发环境及 Python 基础 

116 页 PDF 小册子:机器学习中的概率论、统计学、线性代数 

史上最全!371 张速查表,涵盖 AI、ChatGPT、Python、R、深度学习、机器学习等

以上就是一个超强的代码Agent大模型,开源了,本地部署的详细内容,更多请关注其它相关文章!


# 一言  # 浏阳房地产营销推广公司  # 智能seo系统是干嘛的  # 五台山网络营销推广平台  # 手机网站优化技巧  # 创业服装营销推广  # 铁岭seo优化怎么样  # 海淀网站建设路小学  # 怎么申请卖书网站推广  # 中国建设银行官网网站  # 中国中建设计集团网站  # 应该是  # 的是  # 官网  # 曾在  # python  # 软件工程  # 企业网站  # 管理系统  # 开源  # 企业网站建设解决方案  # ll  # qwen  # mistral ai  # 本地部署  # deepseek  # claude  # chatgpt  # ai  # 工具 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: j*a数组怎么新增值  怎么在typescript定义集合  云笔记本电脑有什么用  8k是多少钱  春运抢票用不用取票码  calm是什么意思  一年多少周  华为的type-c接口是什么接口  什么是域名解析 域名解析中采用了什么  固态硬盘如何区分好坏  阿里云盘的会员怎么用  如何正确使用固态硬盘  win7怎么关闭360壁纸屏保  春运抢票如何快速抢到票  typescript是什么时候出来的  如何在命令行执行存储过程  空调power灯一直闪是什么意思  汽车的type-c接口是什么  旧固态硬盘如何卖出  openwrt有什么用  165开头的是什么电话号码  自己如何安装固态硬盘  typescript怎么写react  dos命令如何复制目录结构  1tb等于多少mb  空调主板单片机怎么拆开  51单片机怎么连接端口  显示器的power是什么意思  typescript用在哪里  苹果16都有哪些型号  单片机.lib文件怎么打开  m*en repository的作用是什么  typescript是什么类型的语言  单片机显存怎么设置最佳  命令行如何运行j*a  单片机加法程序怎么写  如何查看bash内置的命令  笔记本如何使用固态硬盘  js怎么设置typescript  夸克缺什么登录不了  苹果16哪些型号好用  5G类似微信的聊天软件有哪些  python和typescript学哪个  得物上怎么样申请退换货 得物上退换货详细指南(包含海外)  摩托车上power是什么意思  夸克投屏为什么那么卡  显示器上power键是什么意思  苹果怎么没出5g手机  新网站如何填写域名解析  春运抢票需要抢几天 

搜索