新闻中心
-
05-06ICLR 2025 Spotlight | NoiseDiffusion: 矫正扩散模型噪声,提高插值图片质量作者|PengfeiZheng单位|USTC,HKBUTMLRGroup近年来,生成AI的迅猛发展为文本到图像生成、视频生成等令人瞩目的领域注入了强大的动力。这...
-
05-02参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?多模态AI系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型(如GPT-4V)的研究取得...
-
04-28让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
04-23基于Transformer的高效单阶段短时RGB-T单目标跟踪方法引言如图1所示,现有的三阶段RGB-T单目标跟踪网络通常采用两个独立的特征提取分支,分别负责提取两个模态的特征。然而,相互独立的特征提取分支会导致两个模态在特征...
-
04-22Transformer本可以深谋远虑,但就是不做语言模型是否会规划未来token?这篇论文给你答案。「别让YannLeCun看见了。」YannLeCun表示太迟了,他已经看到了。今天要介绍的这篇「LeCun非...
-
04-17AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊作者|陈旭鹏编辑|ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术...

