新闻中心
-
06-11用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高用神经架构搜索给LLM瘦身,同等准确度可让LLaMA2-7B模型大小降2倍。LLM(大型语言模型)的一个主要特点是“大”,也因此其训练和部署成本相当高,如何在保...
-
06-11i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-07Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想大模型也可解释了?大模型都在想什么?OpenAI找到了一种办法,能给GPT-4做「扫描」,告诉你AI的思路,而且还把这种方法开源了。大语言模型(LLM)是当前A...
-
06-07ICML 2025 Oral|外部引导的深度聚类新范式AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-04高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-03单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率乘法和排序也有效。自2017年被提出以来,Transformer已成为AI大模型的主流架构,一直稳站C位。然而,虽然所有研究者都不得不承认的是,Transfor...

