新闻中心
-
11-14人工智能的研究课题人工智能(AI)研究课题1.生成式人工智能基础研究智能涌现机理:探索生成式模型如何从海量数据中展现智能特性。神经网络架构:设计高效的神经网络结构,如改进的Tra...
-
11-14Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-12当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-12LoRA、完全微调到底有何不同?MIT 21页论文讲明白了本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应(LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。微调(Fin...
-
11-07字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态...
-
11-04NeurIPS 2025 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

