新闻中心
-
11-14Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-14首个多模态连续学习综述,港中文、清华、UIC联合发布AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-12当今最复杂的椭圆曲线找到了!29个独立有理点打破18年记录又是计算机帮了忙。对现代密码学稍有了解的人都必定听过椭圆曲线的赫赫威名,但椭圆曲线本身依然还存在很多悬而未决的问题。今天,量子杂志作者JosephHowlett...
-
11-12连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路昨天,TheInformation的一篇文章让AI社区炸了锅。这篇文章透露,OpenAI下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量...
-
11-12当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-12LoRA、完全微调到底有何不同?MIT 21页论文讲明白了本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应(LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。微调(Fin...

