新闻中心
-
01-23神经网络和深度学习中的损失函数的作用深度学习中的损失函数用于评估神经网络模型的性能。在神经网络中,存在两种主要的数学运算,即前向传播和梯度下降反向传播。不论是哪种运算,神经网络的目标都是最小化损失...
-
01-22图片识别中的应用和示例以及误差反向传播算法的原理误差反向传播是常用机器学习算法,广泛应用于神经网络训练,尤其在图片识别领域。本文将介绍该算法在图片识别中的应用、原理和示例。一、误差反向传播算法的应用图片识别是...
-
01-22深入探讨机器学习中的降维概念:什么是降维?降维是一种通过优化机器学习模型的训练数据输入变量来减少模型训练成本的技术。在高维数据中,输入变量的数量可能非常庞大,降维的目的是尽可能地保留原始数据的可变性。通...
-
01-22BI-LSTM: 无遗漏长短期记忆网络的解释及分析双向长短期记忆(bi-LSTM)是一种神经网络结构,能够同时处理序列数据的向后和向前信息。在双向中,输入在两个方向上流动,常规LSTM只能沿一个方向流动,而BI...
-
01-22文本数据的标记化、映射和填充对增强的意义和方法为了进行机器学习或自然语言处理任务,需要将文本转换为数字表示形式,这被称为文本数据增强。文本数据增强通常包括标记化、映射和填充三个步骤。一、标记化标记化是将文本...
-
01-04A800显著超越Llama2推理RTX3090与4090,表现优异的延迟和吞吐量大型语言模型(LLM)在学界和业界都取得了巨大的进展。但训练和部署LLM非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速LLM预训练、微调和推...

