新闻中心
-
10-23NeurIPS 2025 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-21又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-16补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势一个token就能控制模型快些解答或慢点思考。OpenAIο1模型的发布掀起了人们对AI推理过程的关注,甚至让现在的AI行业开始放弃卷越来越大的模型,而是开始针...
-
10-15大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-15北大林宙辰团队全新混合序列建模架构MixCon:性能远超MambaAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-13给小学数学题加句「废话」,OpenAI o1就翻车了,苹果新论文质疑AI推理能力苹果新论文:AI大模型可能不会推理。AI大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否...

