新闻中心
-
04-08为什么大型语言模型都在使用 SwiGLU 作为激活函数?如果你一直在关注大型语言模型的架构,你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文...
-
04-03Transformer引领AI百花齐放:从算法创新到产业应用,一文读懂人工智能的未来一、引言近年来,人工智能技术取得了举世瞩目的成果,其中,自然语言处理(NLP)和计算机视觉等领域的研究尤为突出。在这些领域,一种名为Transformer的模型...
-
03-15超强!深度学习Top10算法!自2006年深度学习概念被提出以来,20年快过去了,深度学习作为人工智能领域的一场革命,已经催生了许多具有影响力的算法。那么,你所认为深度学习的top10算法有...
-
03-11我们一起聊聊大模型的模型融合方法在以前的实践中,模型融合被广泛运用,尤其在判别模型中,它被认为是一种能够稳定提升性能的方法。然而,对于生成语言模型而言,由于其涉及解码过程,其运作方式并不像判别...
-
03-06Gen AI对下一代交通领域的影响下一代交通依赖于电子、可持续性和体验作为其设计的核心,GenAI对设想的下一代交通生态系统的每种模式都有影响。市场有五个特定的重点领域:EV(电动汽车)、AV(...
-
02-16谷歌Gemini1.5火速上线:MoE架构,100万上下文今天,谷歌宣布推出Gemini1.5。Gemini1.5是在谷歌基础模型和基础设施的研究与工程创新基础上开发的。这个版本引入了新的专家混合(MoE)架构,以提高...

