新闻中心
-
06-06LLM | Yuan 2.0-M32:带注意力路由的专家混合模型图片一、结论写在前面Yuan+2.0-M32是一种基础架构,与Yuan-2.0+2B相似,采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
-
05-27Bengio等人新作:注意力可被视为RNN,新模型媲美Transformer,但超级省内存序列建模的进展具有极大的影响力,因为它们在广泛的应用中发挥着重要作用,包括强化学习(例如,机器人和自动驾驶)、时间序列分类(例如,金融欺诈检测和医学诊断)等。在...
-
05-24世界模型也扩散!训练出的智能体竟然不错世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期,世界模型主要对离散潜在变量序列进行操作来模拟环境动态。然而,这种压缩为紧凑离散表征的方法...
-
04-08太全了!多模态深度学习的综述!1.介绍我们对世界的体验是多模态的——我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某个条件发生或经历的方式,当一个研究问题包含多个模态时,它...
-
03-08田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型MetaFAIR田渊栋参与的研究项目在上个月获得了广泛好评。在他们的论文《MobileLLM:OptimizingSub-billionParameterLan...
-
12-022025年多动症干预新进展——从人工智能到虚拟现实大家好,我是涛哥,一个致力于研究ADHD的研究者(关于涛哥如何应对ADHD的方法,将在两年后毕业时分享)随着科技的发展迅猛,对于多动症(ADHD)的干预方法也在...

