新闻中心
-
12-14新的Range View3D检测思路:RangePerception标题重写:范围感知:驯服LiDAR范围视图以实现高效准确的3D物体检测请点击以下链接查看论文:https://openreview.net/pdf?id=9kF...
-
12-05让3D编辑像PS一样简单,新算法GaussianEditor在几分钟内完成3D场景增删改3D编辑在游戏和虚拟现实等领域中发挥着至关重要的作用,然而之前的3D编辑苦于耗时间长以及可控性差等问题,很难应用到实际场景。近日,南洋理工大学联合清华和商汤提出...
-
12-04新标题:北京大学开创新纪元:类别级6D物体位姿估计新范式在NeurIPS 2025取得最新最佳结果北京大学的研究人员提出了一种新的类别级6D物体位姿估计方法,这是一个基础且重要的问题,广泛应用于机器人、虚拟现实和增强现实等领域。他们在这篇论文中取得了新的SO...
-
12-04横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%为了应对多模态大语言模型中视觉信息提取不充分的问题,哈尔滨工业大学(深圳)的研究人员提出了双层知识增强的多模态大语言模型-九天(JiuTian-LION)。需要...
-
12-04手机上图像0.2秒即可呈现,谷歌构建最快的移动扩散模型MobileDiffusion在手机等移动端侧运行StableDiffusion等文生图生成式AI大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。近日,来自谷歌的一篇论文「M...
-
12-04来一趟未来之旅,首个多视图预测+规划自动驾驶世界模型抵达近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端...

