新闻中心

InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型

2025-09-18
浏览次数:
返回列表

InternVLA·M1是什么

internvla·m1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策略,先通过空间感知预训练,增强空间推理与规划能力;再以隐式空间推理方式实现高效的动作后训练。仅需“空间规划提示”即可高效训练,大幅降低成本。在 simplerenv 等公开操作基准测试中,internvla·m1 达到国际领先水平,其指令跟随与未见物体泛化能力显著优于其他同类模型。依托自研*平台 interndata-m1 完成大规模预训练,适用于复杂场景及长程任务。

GoEnhance GoEnhance

全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。

GoEnhance 347 查看详情 GoEnhance

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型

InternVLA·M1的主要功能

  • 高阶空间推理与任务规划:负责复杂环境下的空间推理和任务规划,能理解指令并生成相应的操作序列。
  • 双系统操作架构:采用两阶段训练策略,先进行空间感知预训练,再进行动作后训练,提升模型的推理和规划能力。
  • 高效训练与成本控制:通过“空间规划提示”实现高效训练,大幅降低训练成本和时间。
  • 指令跟随与泛化能力:在多种公开基准测试中表现优异,尤其在指令跟随和未见物体泛化方面表现突出。
  • 自主学习与闭环控制:构建了“思考-行动-自主学习”的完整闭环,能够通过自主学习不断优化操作策略。
  • 复杂场景适应性:在真机复杂场景及长程任务中表现出色,适用于多种实际应用场景。

InternVLA·M1的技术原理

  • 双系统架构:结合空间感知预训练和动作后训练,增强模型对空间环境的理解和操作能力。
  • 空间感知预训练:通过大规模*数据,训练模型对空间关系的感知和推理能力,为后续任务规划奠定基础。
  • 动作后训练:利用隐式空间推理方式,使模型能高效地学习具体动作的执行,提升操作精度。
  • 空间规划提示:引入空间规划提示机制,帮助模型更高效地进行任务规划和动作生成,降低训练复杂度。
  • 闭环控制:构建“思考-行动-自主学习”的闭环系统,使模型能在实际操作中不断学习和优化,适应复杂环境。
  • 大规模*数据:依托自研*平台 InternData-M1,生成大量高质量的训练数据,支持模型的大规模预训练。
  • 指令驱动:模型能接收自然语言指令,解析指令内容,生成相应的操作序列,实现指令跟随功能。

InternVLA·M1的项目地址

  • 项目官网:http://internrobotics.github.io/internvla-m1.github.io/
  • Github仓库:http://github.com/InternRobotics/InternVLA-M1
  • HuggingFace模型库:http://huggingface.co/collections/InternRobotics/internvla-m1-68c96eaebcb5867786ee6cf3
  • HuggingFace数据链接:http://huggingface.co/datasets/InternRobotics/InternData-M1
  • 技术论文:http://github.com/InternRobotics/InternVLA-M1/blob/InternVLA-M1/assets/InternVLA_M1.pdf

InternVLA·M1的应用场景

  • 工业自动化:在工厂环境中,用于自动化生产线上的复杂任务,如零部件组装、物料搬运和质量检测,提高生产效率和精准度。
  • 物流与仓储:优化物流中心的货物分拣、搬运和存储操作,实现自动化仓库管理,提升物流效率和准确性。
  • 服务机器人:在家庭、酒店、医院等场景中,为人们提供清洁、送餐、护理等服务,提升生活质量和服务效率。
  • 智能安防:用于安防监控中的异常行为检测、区域巡逻和安全检查,增强安防系统的智能化水平。
  • 教育与科研:作为教学和科研工具,帮助学生和研究人员探索机器人技术、人工智能和自动化控制等领域。
  • 灾难救援:在地震、火灾等灾害现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。
  • 农业自动化:用于农作物种植、采摘和灌溉等环节,实现农业生产的自动化和智能化,提高农业生产力。

以上就是InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型的详细内容,更多请关注其它相关文章!


# 开源  # 湖州网站建设代运营公司  # 宜春seo优惠  # 藤桥网站建设  # 雅安企业网站推广服务  # 广东seo软件厂家排名  # 营销推广月度总结报告  # 广州天河定制网站建设  # 网站推广软件_yangzai231030  # 网站推广分享赚钱工具  # 傻SEO佬  # 一键  # 未见  # 适用于  # git  # 安防  # 自主学习  # 双系统  # 长程  # 闭环  # 机器人技术  # 上海  # 大模型  # pdf  # ai  # 工具  # 人工智能  # github 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 夸克解压什么意思  春运抢票哪里最火热  空调控制面板power灯一直亮是什么意思  春运抢票多久可以买到票  基金市盈率是什么意思  typescript怎么加号  夸克是什么空间单位  市盈率底下 18A 19E 是什么意思  命令行下如何导出数据库  移动固态硬盘如何使用  如何为服务器配置静态路由?服务器配置静态路由详细教程  j*a数组元素怎么用  电瓶车的power是什么意思  广东春运几点抢票  交管12123协议头不完整是什么原因  typescript怎么使用map  如何测固态硬盘芯片  春运抢票可以抢几次票  vue组件typescript怎么用  夸克po什么意思  cron表达式在线工具有哪些  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  ao3镜像网站哪个好  苹果16哪些型号好用  新网站如何填写域名解析  苹果16新增哪些功能  怎么把手机里爱奇艺的视频下载到u盘里  sofa是什么意思  vivo手机nfc功能是什么意思  苹果16改进了哪些  ai文件里无法找到链接文件要怎么解决步骤  a03怎么根据编号找文链接入口  手机拍显示屏有条纹怎么去除  early什么意思  智能锁type-c接口是什么  征信信用不好如何恢复 征信信用不好如何恢复指南  酷我音乐怎么改每日推荐 酷我音乐每日推荐修改方法  typescript用在哪里  33000日元等于多少人民币  混合固态硬盘如何分区  .asm如何在命令行运行  路由器power灯一直亮是什么意思  苹果16将会带来哪些升级  为什么进行域名解析  单片机计数程序怎么写  如何打开命令提示符  苹果16讲解有哪些功能  如何通过命令行启动tomcat  楔子是什么意思  单片机怎么加死循环 

搜索