新闻中心
-
03-02DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%大型语言模型(LLM)在执行任务时也可能面临“过度思考”的困境,导致效率低下甚至失败。近期,来自加州大学伯克利分校、UIUC、ETHZurich和CMU等机构的...
-
02-28探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平AIxiv专栏持续关注并报道全球顶尖AI研究成果。多年来,我们已发布超过2000篇学术及技术文章,涵盖众多高校和企业实验室的领先研究。欢迎优秀研究者投稿或联系我...
-
02-28ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满DataMan:提升大语言模型预训练效率的数据管理器AIxiv专栏持续报道全球顶尖AI研究成果。本文介绍由浙江大学和阿里巴巴千问团队合作完成的一项研究,该研究针...
-
02-28谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分谷歌发布超高难度AI基准测试:BIG-BenchExtraHard(BBEH),挑战现有模型极限!近期,谷歌推出全新AI基准测试BBEH,其难度远超现有基准,旨...
-
02-27无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了AIxiv专栏:探索无编码器架构在3D大型多模态模型中的潜力AIxiv专栏持续报道全球顶尖AI研究成果,已收录2000余篇来自高校和企业实验室的学术技术文章。欢...
-
02-26千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限2025年,视频生成技术,特别是基于扩散模型的视频生成,持续发展创新,涌现出众多令人惊艳的文生视频和图生视频模型。然而,长视频生成一直是该领域的一大难题。麻省理...

