新闻中心
-
10-12机器人瓦力来了!迪士尼亮出新机器人,用RL学习走路,还能进行社交互动当、当、当,「瓦力机器人」登场!扁扁的脑袋、四四方方的身体,你指着地面让它看,它还会歪歪头表示不解。然而,它并非瓦力,真正的瓦力长得像这样!这个可爱的小机器人由...
-
10-12陈丹琦团队创新之作:以5%成本取得SOTA,掀起“羊驼剪毛”大法热潮只用3%的计算量、5%的成本取得SOTA,统治了1B-3B规模的开源大模型。这一成果来自普林斯顿陈丹琦团队,名为LLM-Shearing大模型剪枝法。以羊驼LL...
-
10-11在图像、视频生成上,语言模型首次击败扩散模型,tokenizer是关键大型语言模型(LLM或LM)最初用于生成语言,但随着时间的推移,它们已经能够生成多种模态的内容,并在音频、语音、代码生成、医疗应用、机器人学等领域开始占据主导地...
-
10-11文生3D模型大突破!MVDream重磅来袭,一句话生成超逼真三维模型这真是太不可思议了!现在只需打几个字就能轻松地创造出精美而高质量的3D模型了?这不,国外一篇博客引爆网络,把一个叫MVDream的东西摆到了我们面前。用户只需要...
-
10-10更通用、有效,蚂蚁自研优化器WSAM入选KDD Oral深度神经网络(DNNs)的泛化能力与极值点的平坦程度密切相关,因此出现了Sharpness-AwareMinimization(SAM)算法来寻找更平坦的极值点...
-
10-077.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2025大型语言模型在性能方面表现出色,能够通过零样本或少样本提示来解决新任务。然而,在实际应用部署中,LLM却不太实用,因为它的内存利用效率低,同时需要大量的计算资源...

