新闻中心
-
12-14新标题:实时渲染进化!基于射线的三维重建创新方法图片论文链接:https://arxiv.org/pdf/2310.19629代码链接:https://github.com/vLAR-group/RayDF主...
-
12-04新标题:北京大学开创新纪元:类别级6D物体位姿估计新范式在NeurIPS 2025取得最新最佳结果北京大学的研究人员提出了一种新的类别级6D物体位姿估计方法,这是一个基础且重要的问题,广泛应用于机器人、虚拟现实和增强现实等领域。他们在这篇论文中取得了新的SO...
-
12-04横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%为了应对多模态大语言模型中视觉信息提取不充分的问题,哈尔滨工业大学(深圳)的研究人员提出了双层知识增强的多模态大语言模型-九天(JiuTian-LION)。需要...
-
12-03全球瞩目的「科目三」:梅西、钢铁侠、二次元小姐姐轻松应对最近一段时间,你可能或多或少的听到过「科目三」,摇花手、半崴不崴的脚,配合着节奏鲜明的音乐,这一舞蹈动作遭全网模仿。如果相似的舞蹈,让AI生成会怎样?就像下图所...
-
11-27结合物理引擎,GPT-4+扩散模型生成逼真、连贯、合理视频扩散模型的引入推动了文本生成视频技术的发展,然而,这些方法往往计算成本高昂,且难以实现流畅的物体运动视频为了应对这些问题,来自中国科学院深圳先进技术研究院、中国...
-
11-13我们一起聊聊知识抽取,你学会了吗?一、简介知识抽取通常指从非结构化文本中挖掘结构化信息,例如含有丰富语义信息的标签和短语。这在业界被广泛应用于内容理解和商品理解等场景,通过从用户生成的文本信息中...

