新闻中心
-
01-3127页综述,354篇参考文献!最详尽的视觉定位综述来了这篇关于视觉定位综述的论文,系统回顾了过去十年该领域的发展,尤其关注近五年的突破性进展。文章涵盖了各种视觉定位方法,包括基于检测器、VLP和MLLM的方法,以及...
-
12-16决策过程是魔法还是科学?首个多模态大模型的可解释性综述全面深度剖析这篇综述论文探讨了多模态大型语言模型(MLLM)的可解释性。研究人员来自香港科技大学(广州)、上海人工智能实验室、中国人民大学和南洋理工大学。该论文对MLLM可...
-
11-27遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度原来早在2017年,百度就进行过ScalingLaw的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律s...
-
11-14Scaling Laws终结,量化无用,AI大佬都在审视这篇论文研究表明,你训练的token越多,你需要的精度就越高。最近几天,AI社区都在讨论同一篇论文。UCSD助理教授DanFu说它指明了大模型量化的方向。CMU教授Ti...
-
11-06调研180多篇论文,这篇综述终于把大模型做算法设计理清了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-11这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机Transformer的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如本站曾报道过的Reform...

