新闻中心
-
10-22自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-21又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-13给小学数学题加句「废话」,OpenAI o1就翻车了,苹果新论文质疑AI推理能力苹果新论文:AI大模型可能不会推理。AI大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否...
-
10-11这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机Transformer的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如本站曾报道过的Reform...
-
10-08中国科学院团队发布GeneCompass:解析基因调控密码,打造干湿融合新范式作者|中国科学院多学科交叉研究团队编辑|ScienceAI近年来,大语言模型(LLMs)已在自然语言、计算机视觉等通用领域引发了新一轮技术革命,通过大规模语料和...
-
09-20o1带火的CoT到底行不行?新论文引发了论战ToCoTornottoCoT?OpenAIο1的诞生极大地提升了人们对LLM推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有LLM的标配...

