新闻中心
-
11-11NeurIPS 2025 (Oral) | 如何量化与提升思维链的推理能力边界?AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-07字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态...
-
11-06OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全在大算力和大数据让基于统计的AI模型真正变得强大且有用之前,基于规则的系统长期以来是语言模型的主导范式。顾名思义,基于规则的系统就是依赖人类编码的规则来执行决策...
-
10-22自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-15大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-15北大林宙辰团队全新混合序列建模架构MixCon:性能远超MambaAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

