工程_第36页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

06-11

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

用神经架构搜索给LLM瘦身，同等准确度可让LLaMA2-7B模型大小降2倍。LLM（大型语言模型）的一个主要特点是“大”，也因此其训练和部署成本相当高，如何在保...
06-11

i人小助手：Meta推出多模态对话图，帮你轻松识别社交状态

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
06-07

Ilya参与，OpenAI给GPT-4搞可解释，提取了1600万个特征，还能看它怎么想

大模型也可解释了？大模型都在想什么？OpenAI找到了一种办法，能给GPT-4做「扫描」，告诉你AI的思路，而且还把这种方法开源了。大语言模型（LLM）是当前A...
06-07

ICML 2025 Oral｜外部引导的深度聚类新范式

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
06-04

高效、可泛化的高斯重建框架，只需3张视图即可快速推理，45秒便可完成优化

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
06-03

单GPU训练一天，Transformer在100位数字加法上就达能到99%准确率

乘法和排序也有效。自2017年被提出以来，Transformer已成为AI大模型的主流架构，一直稳站C位。然而，虽然所有研究者都不得不承认的是，Transfor...

: 电话

: 客服

: 地图

: 搜索