新闻中心
-
05-09LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)写在前面&笔者的个人理解这篇论文致力于解决当前多模态大语言模型(MLLMs)在自动驾驶应用中存在的关键挑战,即将MLLMs从2D理解扩展到3D空间的问题...
-
05-03Transformer要变Kansformer?用了几十年的MLP迎来挑战者KANMLP(多层感知器)用了几十年了,真的没有别的选择了吗?多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP的重要性无论怎样...
-
05-01在12个视频理解任务中,Mamba先打败了Transformer本站发布学术、技术内容的专栏。近年来,本站AIxiv专栏接收报道超过2000篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的...
-
04-25颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。项目主页&Demo:https://vitron-llm.github....
-
04-17AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊作者|陈旭鹏编辑|ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术...
-
04-12LiDAR*新思路 | LidarDM:助力4D世界生成,*杀器~原标题:LidarDM:GenerativeLiDARSimulationinaGeneratedWorld论文链接:https://arxiv.org/pdf...

