新闻中心
-
07-12首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-03ASQuery:基于Query的时序动作分割新架构1.前言北京邮电大学与EVOL创新团队和ACG工业算法组针对时序动作分割任务共同提出了基于query新架构的模型ASQuery。ASQuery包含了动作及边界两...
-
04-26颜水成挂帅,昆仑万维2050全球研究院联合NUS、NTU发布Vitron,奠定通用视觉多模态大模型终极形态近日,由颜水成教授带队,昆仑万维2050全球研究院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。这是一款重...
-
04-23基于Transformer的高效单阶段短时RGB-T单目标跟踪方法引言如图1所示,现有的三阶段RGB-T单目标跟踪网络通常采用两个独立的特征提取分支,分别负责提取两个模态的特征。然而,相互独立的特征提取分支会导致两个模态在特征...
-
04-17一句话打造Agent!李彦宏:人人都是开发者的时代到来大模型颠覆一切,终于还是颠到了本小编头上。还是一个一句话就被打造出来的Agent。像这样,抛给Ta一篇文章,不到1秒,标题建议就新鲜出炉了。这效率,比起本人类,...
-
03-15向数字世界AGI迈进!智能体已经从头开玩「荒野大镖客 2」了通用计算机控制信息革命产生了数字世界,数字世界为大模型的诞生提供了数据,也最容易实现通用人工智能(AGI)。向数字世界AGI迈进,北京智源人工智能研究院、新加坡...

