新闻中心
-
07-25TPAMI 2025 | ProCo: 无限contrastive pairs的长尾对比学习AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-15Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%研究者表示,如果Sytem2蒸馏可以成为未来持续学习AI系统的重要特征,则可以进一步提升System2表现不那么好的推理任务的性能。谈到大语言模型(LLM)的策...
-
07-10单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE释放进一步扩展Transformer的潜力,同时还可以保持计算效率。标准Transformer架构中的前馈(FFW)层会随着隐藏层宽度的增加而导致计算成本和激活...
-
07-09单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速微软的这项研究让开发者可以在单卡机器上以10倍的速度处理超过1M的输入文本。大型语言模型(LLM)已进入长上下文处理时代,其支持的上下文窗口从先前的128K猛增...
-
07-01ICML 2025| 大语言模型助力基于CLIP的分布外检测任务当训练数据集和测试数据集的分布相同时,机器学习模型可以表现出优越的性能。然而在开放世界环境中,模型经常会遇到分布外(Out-of-Distribution,OO...
-
06-14腾讯混元联合港科大及清华推出「Follow Your Emoji」, 一键让照片变表情包图生视频又有新玩法。腾讯混元联合港科大、清华大学联合推出肖像动画生成框架“FollowYourEmoji”,可以通过人脸骨架信息生成任意风格的脸部动画。基于算法...

