新闻中心
-
02-19RNN模型挑战Transformer霸权!1%成本性能比肩Mistral-7B,支持100+种语言全球最多在大模型内卷的同时,Transformer的地位也接连受到挑战。近日,RWKV发布了Eagle7B模型,基于最新的RWKV-v5架构。Eagle7B在多语言基准...
-
02-04Agent像人一样分工协作,还能“群聊”交换信息智能体也要有“规范手册”!一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增...
-
01-29揭开LLM巫师的魔杖,UIUC华人团队揭示代码数据的三大优势大模型时代的语言模型(LLM)尺寸和训练数据都增加了,包括自然语言和代码。代码是人类和计算机之间的媒介,将高级目标转换为可执行的中间步骤。它具有语法标准、逻辑一...
-
01-29OpenAI联合创始人Karpathy发布文章:以自动驾驶为例解释AGI!已删除的原文,请立即收藏对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研...
-
01-26ICLR为什么没有接受Mamba论文?AI社区掀起了大讨论2023年,AI大模型领域的统治者Transformer的地位开始受到挑战。一种新的架构名为「Mamba」崭露头角,它是一种选择性状态空间模型,在语言建模方面与...
-
01-25GRU简介及其优缺点及应用GRU代表门控循环单元,是一种类似于LSTM的循环神经网络架构,用于捕获顺序数据中的长期依赖关系。与LSTM相比,GRU具有更少的参数,从而降低了计算成本。它由...

