新闻中心
-
07-15豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-11北大具身智能团队提出需求驱动导航,对齐人类需求,让机器人更高效想象一下,如果机器人能够听懂你的需求,并努力满足,是不是很美好呢?如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如...
-
05-27港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体当前,多模态大模型(MLLM)在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。比如,模型能...
-
05-17CVPR'24 Oral | 一览纯稀疏点云检测器SAFDNet的前世今生!写在前面&笔者的个人理解3D点云物体检测对自动驾驶感知至关重要,如何高效地从稀疏点云数据中学习特征表示是3D点云物体检测领域的一个关键挑战。我们在本文中...
-
05-09综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!推荐系统对于应对信息过载挑战重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。然而,由于...
-
04-17无向图最小割问题取得新突破,谷歌研究获SODA 2025最佳论文奖谷歌博客放出新研究,求解无向图的最小割问题。1996年,美国计算机科学家DavidRKarger连同其他研究者在论文《Anewapproachtothemini...

