新闻中心
InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型
InternVLA·M1是什么
internvla·m1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策略,先通过空间感知预训练,增强空间推理与规划能力;再以隐式空间推理方式实现高效的动作后训练。仅需“空间规划提示”即可高效训练,大幅降低成本。在 simplerenv 等公开操作基准测试中,internvla·m1 达到国际领先水平,其指令跟随与未见物体泛化能力显著优于其他同类模型。依托自研*平台 interndata-m1 完成大规模预训练,适用于复杂场景及长程任务。
GoEnhance
全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。
347
查看详情
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

InternVLA·M1的主要功能
- 高阶空间推理与任务规划:负责复杂环境下的空间推理和任务规划,能理解指令并生成相应的操作序列。
- 双系统操作架构:采用两阶段训练策略,先进行空间感知预训练,再进行动作后训练,提升模型的推理和规划能力。
- 高效训练与成本控制:通过“空间规划提示”实现高效训练,大幅降低训练成本和时间。
- 指令跟随与泛化能力:在多种公开基准测试中表现优异,尤其在指令跟随和未见物体泛化方面表现突出。
- 自主学习与闭环控制:构建了“思考-行动-自主学习”的完整闭环,能够通过自主学习不断优化操作策略。
- 复杂场景适应性:在真机复杂场景及长程任务中表现出色,适用于多种实际应用场景。
InternVLA·M1的技术原理
- 双系统架构:结合空间感知预训练和动作后训练,增强模型对空间环境的理解和操作能力。
- 空间感知预训练:通过大规模*数据,训练模型对空间关系的感知和推理能力,为后续任务规划奠定基础。
- 动作后训练:利用隐式空间推理方式,使模型能高效地学习具体动作的执行,提升操作精度。
- 空间规划提示:引入空间规划提示机制,帮助模型更高效地进行任务规划和动作生成,降低训练复杂度。
- 闭环控制:构建“思考-行动-自主学习”的闭环系统,使模型能在实际操作中不断学习和优化,适应复杂环境。
- 大规模*数据:依托自研*平台 InternData-M1,生成大量高质量的训练数据,支持模型的大规模预训练。
- 指令驱动:模型能接收自然语言指令,解析指令内容,生成相应的操作序列,实现指令跟随功能。
InternVLA·M1的项目地址
- 项目官网:http://internrobotics.github.io/internvla-m1.github.io/
- Github仓库:http://github.com/InternRobotics/InternVLA-M1
- HuggingFace模型库:http://huggingface.co/collections/InternRobotics/internvla-m1-68c96eaebcb5867786ee6cf3
- HuggingFace数据链接:http://huggingface.co/datasets/InternRobotics/InternData-M1
- 技术论文:http://github.com/InternRobotics/InternVLA-M1/blob/InternVLA-M1/assets/InternVLA_M1.pdf
InternVLA·M1的应用场景
- 工业自动化:在工厂环境中,用于自动化生产线上的复杂任务,如零部件组装、物料搬运和质量检测,提高生产效率和精准度。
- 物流与仓储:优化物流中心的货物分拣、搬运和存储操作,实现自动化仓库管理,提升物流效率和准确性。
- 服务机器人:在家庭、酒店、医院等场景中,为人们提供清洁、送餐、护理等服务,提升生活质量和服务效率。
- 智能安防:用于安防监控中的异常行为检测、区域巡逻和安全检查,增强安防系统的智能化水平。
- 教育与科研:作为教学和科研工具,帮助学生和研究人员探索机器人技术、人工智能和自动化控制等领域。
-
灾难救援:在地震、火灾等灾害
现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。
- 农业自动化:用于农作物种植、采摘和灌溉等环节,实现农业生产的自动化和智能化,提高农业生产力。
以上就是InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型的详细内容,更多请关注其它相关文章!
# 开源
# 湖州网站建设代运营公司
# 宜春seo优惠
# 藤桥网站建设
# 雅安企业网站推广服务
# 广东seo软件厂家排名
# 营销推广月度总结报告
# 广州天河定制网站建设
# 网站推广软件_yangzai231030
# 网站推广分享赚钱工具
# 傻SEO佬
# 一键
# 未见
# 适用于
# git
# 安防
# 自主学习
# 双系统
# 长程
# 闭环
# 机器人技术
# 上海
# 大模型
# pdf
# ai
# 工具
# 人工智能
# github
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
夸克解压什么意思
春运抢票哪里最火热
空调控制面板power灯一直亮是什么意思
春运抢票多久可以买到票
基金市盈率是什么意思
typescript怎么加号
夸克是什么空间单位
市盈率底下 18A 19E 是什么意思
命令行下如何导出数据库
移动固态硬盘如何使用
如何为服务器配置静态路由?服务器配置静态路由详细教程
j*a数组元素怎么用
电瓶车的power是什么意思
广东春运几点抢票
交管12123协议头不完整是什么原因
typescript怎么使用map
如何测固态硬盘芯片
春运抢票可以抢几次票
vue组件typescript怎么用
夸克po什么意思
cron表达式在线工具有哪些
酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南
ao3镜像网站哪个好
苹果16哪些型号好用
新网站如何填写域名解析
苹果16新增哪些功能
怎么把手机里爱奇艺的视频下载到u盘里
sofa是什么意思
vivo手机nfc功能是什么意思
苹果16改进了哪些
ai文件里无法找到链接文件要怎么解决步骤
a03怎么根据编号找文链接入口
手机拍显示屏有条纹怎么去除
early什么意思
智能锁type-c接口是什么
征信信用不好如何恢复 征信信用不好如何恢复指南
酷我音乐怎么改每日推荐 酷我音乐每日推荐修改方法
typescript用在哪里
33000日元等于多少人民币
混合固态硬盘如何分区
.asm如何在命令行运行
路由器power灯一直亮是什么意思
苹果16将会带来哪些升级
为什么进行域名解析
单片机计数程序怎么写
如何打开命令提示符
苹果16讲解有哪些功能
如何通过命令行启动tomcat
楔子是什么意思
单片机怎么加死循环


2025-09-18
浏览次数:次
返回列表
现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。