新闻中心
-
01-22如何选择机器学习任务中的交叉熵和稀疏交叉熵?在机器学习任务中,损失函数是评估模型性能的重要指标,用于衡量模型预测结果与真实结果之间的差异。交叉熵是一种常见的损失函数,广泛应用于分类问题。它通过计算模型预测...
-
01-22如何使用Siamese网络处理样本不平衡的数据集(含示例代码)Siamese网络是一种用于度量学习的神经网络模型,它能够学习如何计算两个输入之间的相似度或差异度量。由于其灵活性,它在人脸识别、语义相似性计算和文本匹配等众多...
-
01-22优化随机森林的超参数随机森林是一种强大的机器学习算法,因其能够处理复杂数据集和实现高精度的能力而备受欢迎。然而,在某些给定的数据集上,随机森林的默认超参数可能无法达到最佳效果。因此...
-
01-22数据拆分的技术和陷阱——训练集、验证集与测试集的使用方式为了构建可靠的机器学习模型,数据集的拆分是必不可少的。拆分过程包括将数据集分为训练集、验证集和测试集。本文旨在详细介绍这三个集合的概念、数据拆分的技术以及容易出...
-
01-22如何处理非独立同分布数据及常用方法非独立同分布是指数据集中的样本之间不满足独立同分布条件。这意味着样本不是从同一分布中独立采样得到的。这种情况可能对某些机器学习算法的性能产生负面影响,特别是在分...
-
01-12基于双任务的端到端无模板反应预测模型重新排版|X本文旨在介绍西南交通大学杨燕/江永全团队在《应用智能》杂志上发表的研究成果,其中的第一作者是胡昊哲,一位硕士生论文链接:https://doi.or...

