新闻中心
-
04-16DeepMind升级Transformer,前向通过FLOPs最多可降一半引入混合深度,DeepMind新设计可大幅提升Transformer效率。Transformer的重要性无需多言,目前也有很多研究团队致力于改进这种变革性技术,...
-
04-16极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
02-26用扩散模型生成网络参数,LeCun点赞尤洋团队新研究如果你有被Sora生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它在许多其它不同领域也有着让人期待的应用...
-
02-22爆火Sora背后的技术,一文综述扩散模型的最新发展方向为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如VAEs的...
-
01-24Baum-Welch算法在隐式马尔科夫模型中的应用隐式马尔科夫模型(HMM)是用于对时间序列数据进行建模和预测的常用统计模型。Baum-Welch算法,又称为前向-后向算法,是一种无监督学习算法,用于HMM参数...
-
01-23初步认识神经网络单元,又称为节点或神经元,是神经网络的核心。每个单元接收一个或多个输入,将每个输入乘以一个权重,然后将加权输入与偏置值相加。接下来,该值将被输入到激活函数中。在...

