新闻中心
-
07-17无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-11ICML 2025高分论文 | 零阶优化器微调大模型,大幅降低内存AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-11大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一...
-
07-10彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态从125M到1.3B的大模型,性能都有提升。难以置信,这件事终于发生了。一种全新的大语言模型(LLM)架构有望代替至今在AI领域如日中天的Transformer...
-
06-05YoloCS:有效降低特征图空间复杂度论文地址:YOLOCS:ObjectDetectionbasedonDenseChannelCompressionforFeatureSpatialSolidi...
-
05-09港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测全新数据图学习领域的数据饥荒问题,又有能缓解的新花活了!OpenGraph,一个基于图的基础模型,专门用于在多种图数据集上进行零样本预测。港大数据智能实验室的负责人Ch...

