新闻中心
-
07-12CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-10单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE释放进一步扩展Transformer的潜力,同时还可以保持计算效率。标准Transformer架构中的前馈(FFW)层会随着隐藏层宽度的增加而导致计算成本和激活...
-
07-10鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆2.4B的Memory3比更大的LLM和RAG模型获得了更好的性能。近年来,大型语言模型(LLM)因其非凡的性能而获得了前所未有的关注。然而,LLM的训练和推理...
-
07-09单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速微软的这项研究让开发者可以在单卡机器上以10倍的速度处理超过1M的输入文本。大型语言模型(LLM)已进入长上下文处理时代,其支持的上下文窗口从先前的128K猛增...
-
07-06华为云董理斌:做难事解难题,盘古大模型以“智”重塑千行万业7月5日,2024世界人工智能大会暨人工智能全球治理高级别会议—“盘古大模型重塑千行万业”分论坛于上海世博中心举办。在“盘古大模型做难事解难题,以‘智’重塑千行...
-
07-01等不来OpenAI的Q*,华为诺亚探索LLM推理的秘密武器MindStar先来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

