新闻中心
-
01-26回顾NeurIPS 2025: 清华ToT推动大型模型成为焦点近日,作为美国前十的科技博客,LatentSpace对于刚刚过去的NeurIPS2023大会进行了精选回顾总结。在NeurIPS会议中,共有3586篇论文被接受...
-
01-23MoE与Mamba携手合作,将状态空间模型推广至数十亿参数规模状态空间模型(SSM)是一种备受关注的技术,它被认为是Transformer的替代选择。相比于Transformer,SSM在处理长上下文任务时能够实现线性时间...
-
01-19清华系初创公司发布全球首个4D骨骼动画框架,实现一键将实景转化为动画,并且能够生成个性化角色苹果最近宣布将于2月2日推出首款虚拟头显设备VisionPro,预计这款XR设备将引领下一代终端的快速发展。随着虚拟显示设备的普及,数字交互将从平面走向立体,立...
-
01-18杨幂与泰勒的混合风格:小红书AI推出SD和ControlNet合适的风格不得不说,现在拍写真真是“简单到放肆”了。真人不用出镜,不用费心凹姿势、搞发型,只需一张本人图像,等待几秒钟,就能获得7种完全不同风格:仔细看,造型/pose全...
-
01-17蚂蚁集团发布新算法,可加快大型模型推理速度2-6倍近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加...
-
01-17小红书搜索团队揭示:验证负样本在大规模模型蒸馏中的重要性大语言模型(LLMs)在推理任务上表现出色,但其黑盒属性和庞大参数量限制了其在实践中的应用。特别是在处理复杂的数学问题时,LLMs有时会出现错误的推理链。传统的...

