llama_第34页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

10-23

NeurIPS 2025 | 解锁大模型知识记忆编辑的新路径，浙大用「WISE」对抗幻觉

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
10-21

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
10-16

补齐Transformer规划短板又不放弃快速思考，田渊栋团队的Dualformer融合System 1和2双重优势

一个token就能控制模型快些解答或慢点思考。OpenAIο1模型的发布掀起了人们对AI推理过程的关注，甚至让现在的AI行业开始放弃卷越来越大的模型，而是开始针...
10-15

大模型合成数据机理分析，人大刘勇团队：信息增益影响泛化能力

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
10-15

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
10-13

给小学数学题加句「废话」，OpenAI o1就翻车了，苹果新论文质疑AI推理能力

苹果新论文：AI大模型可能不会推理。AI大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否...

: 电话

: 客服

: 地图

: 搜索