新闻中心
-
12-26引入长思维链!微信基于阿里千问大模型搞出个翻译版o1微信AI团队最新研究成果DRT-o1:赋予大型语言模型(LLM)长链思维能力,显著提升机器翻译效果!该研究巧妙地将长链思维(CoT)应用于神经机器翻译(MT),...
-
12-264比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级清华大学陈键飞团队推出SageAttention2:实现4-bit即插即用注意力机制,显著提升大模型推理速度AIxiv专栏持续报道全球顶尖AI研究成果。近年来,...
-
12-23AAAI 2025|时间序列演进也是种扩散过程?基于移动自回归的时序扩散预测模型AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
12-23AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
12-22人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力人能逆向思维,LLM也可以吗?北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明,LLM确实可以,并且逆向思维还能帮助提升LLM的正向推理能力!论文一作Justi...
-
12-22重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

