新闻中心
-
12-05NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成斯坦福大学、北京大学和清华大学的研究团队联合推出一项突破性研究成果:无训练指导(Training-FreeGuidance,TFG)框架,为扩散模型的条件生成难...
-
12-05推动大模型自我进化,北理工推出「流星雨计划」北京理工大学计算机科学与技术学院的DIRECTLAB启动了“流星雨”研究计划,旨在探索大模型的自我进化理论与方法。该计划的核心思想源于人类个体能力提升的模式:在...
-
12-02NeurIPS 2025|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性杜克大学和谷歌研究院的研究人员提出了一种名为自驱动Logits进化解码(SLED)的新型解码框架,旨在提高大型语言模型(LLM)的事实准确性,无需外部知识库或额...
-
12-02NeurIPS 2025 | 数学推理场景下,首个分布外检测研究成果来了上海交通大学与阿里巴巴通义实验室合作,在NeurIPS2024上发表了一篇关于数学推理场景下分布外检测的论文,提出了名为“TVScore”的全新算法。该算法利用...
-
11-30多模态慢思考:分解原子步骤以解决复杂数学推理中山大学、香港科技大学、上海交通大学和华为诺亚方舟实验室的研究人员提出了一种名为AtomThink的新框架,旨在提升多模态大语言模型(MLLM)解决高级数学推理...
-
11-28官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake2024年6月,国内领先的大模型应用Kimi携手清华大学MADSys实验室,联合发布了基于KVCache的大模型推理架构Mooncake。该架构通过PD分离和存...

