新闻中心
-
03-11清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!大型模型仅能记忆和理解有限的上下文,这已成为它们在实际应用中的一大制约。例如,对话型人工智能系统常常无法持久记忆前一天的对话内容,这导致利用大型模型构建的智能体...
-
03-07消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强李开复旗下AI公司零一万物,又一位大模型选手登场:90亿参数Yi-9B。它号称Yi系列中的“理科状元”,“恶补”了代码数学,同时综合能力也没落下。在一系列类似规...
-
01-23深入解析BERT模型一、BERT模型能做什么BERT模型是一种基于Transformer模型的自然语言处理模型,用于处理文本分类、问答系统、命名实体识别和语义相似度计算等任务。由于...
-
01-23介绍交叉验证的概念以及常见的交叉验证方法交叉验证是一种常用的机器学习模型性能评估方法。它将数据集划分为多个互不重叠的子集,其中一部分作为训练集,其余部分作为测试集。通过多次模型训练和测试,得到模型的平...
-
01-22比较扩张卷积和空洞卷积的异同及相互关系扩张卷积和空洞卷积是卷积神经网络中常用的操作,本文将详细介绍它们的区别和关系。一、扩张卷积扩张卷积,又称膨胀卷积或空洞卷积,是一种卷积神经网络中的操作。它是在传...
-
01-22全面介绍超参数及其含义超参数是机器学习算法中的调优参数,用于提高算法性能和训练过程。它们在训练之前设定,并通过训练来优化权重和偏差。通过调整超参数,可以改善模型的准确性和泛化能力。如...

