新闻中心
-
06-03单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率乘法和排序也有效。自2017年被提出以来,Transformer已成为AI大模型的主流架构,一直稳站C位。然而,虽然所有研究者都不得不承认的是,Transfor...
-
05-25从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐在AI领域,扩展定律(Scalinglaws)是理解LM扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要...
-
05-23综述!全面概括基础模型对于推动自动驾驶的重要作用写在前面&笔者的个人理解最近来,随着深度学习技术的发展和突破,大规模的基础模型(FoundationModels)在自然语言处理和计算机视觉领域取得了显...
-
05-17CVPR'24 Oral | 一览纯稀疏点云检测器SAFDNet的前世今生!写在前面&笔者的个人理解3D点云物体检测对自动驾驶感知至关重要,如何高效地从稀疏点云数据中学习特征表示是3D点云物体检测领域的一个关键挑战。我们在本文中...
-
05-15MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?写在前面&笔者的个人理解本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过...
-
05-10ICLR 2025 Oral|用巧妙的「传送」技巧,让神经网络的训练更加高效AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

