新闻中心
-
11-17突破无规则稀疏计算边界,编译框架CROSS数倍提升模型性能AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-16率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2025:强鲁棒性的离线变分贝叶斯强化学习本论文作者杨睿是中国科学技术大学2019级硕博连读生,师从王杰教授、李斌教授,主要研究方向为强化学习、自动驾驶等。他曾以第一作者在NeurIPS、KDD等顶级期...
-
11-16NeurIPS 2025 | 无需训练,一个框架搞定开放式目标检测、实例分割本文作者均来自北京大学王选计算机研究所。主要作者包括:林志威,北京大学博士生;王勇涛,北京大学副研究员;汤帜,北京大学研究员。本文介绍了来自北京大学王选计算机研...
-
11-16LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划在LLM应用不断迭代升级更新的当下,图灵奖得主YannLeCun却代表了一股不同的声音。他在许多不同场合都反复重申了自己的一个观点:当前的LLM根本无法理解世界...
-
11-14Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-12LoRA、完全微调到底有何不同?MIT 21页论文讲明白了本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应(LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。微调(Fin...

