新闻中心
-
04-11激发大语言模型空间推理能力:思维可视化提示大语言模型(LLMs)在语言理解和各种推理任务中展现出令人印象深刻的性能。然而,它们在人类认知的关键一面——空间推理上,仍然未被充分研究。人类具有通过一种被称为...
-
04-09北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计从科技圈最新动态来看,最近AI代码生成概念实火。可是,小伙伴们有没有感觉,AI刷程序题比较亮眼,到了企业真实开发场景中,总感觉欠点火候?恰在此时,一位低调的资深...
-
04-09破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」大语言模型的「逆转诅咒」,被解开了!这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。由于风光无两、不可一世的大模型...
-
04-09AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码费马大定理,即将被AI攻克?而且整件事最意味深长的地方在于,AI即将解决的费马大定理,正是为了证明AI无用。曾经,数学属于纯粹的人类智力王国;如今,这片疆土正被...
-
04-09低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法在深度神经网络(DNNs)中,展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究设这种脆弱性可能源于高准确度的DNNs过度依赖...
-
04-08为什么大型语言模型都在使用 SwiGLU 作为激活函数?如果你一直在关注大型语言模型的架构,你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文...

