新闻中心
-
01-23Batch Size的意义及对训练的影响(与机器学习模型有关)BatchSize是指机器学习模型在训练过程中每次使用的数据量大小。它将大量数据分割成小批量数据,用于模型的训练和参数更新。这种分批处理的方式有助于提高训练效率...
-
01-18新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度当前大语言模型的应用受到了序列长度限制的制约,这限制了其在人工智能领域中的应用。例如,在多轮对话、长文本理解和多模态数据处理与生成方面存在一定的挑战。造成这种限...
-
01-18Lightning Attention-2:实现无限序列长度、恒定算力成本和更高建模精度的新一代注意力机制LightningAttention-2是一种新型的线性注意力机制,让长序列的训练和推理成本与1K序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工...
-
01-17NVIDIA GeForce RTX 4070 SUPER评测:超强2K高刷屏体验,出色的AI性能今年的CES2024上,NVIDIA发布了很多AI相关的产品,包括RTX40SUPER系列显卡。本次我们测试的GEFORCERTX4070SUPER,按照NVI...
-
01-13全新智能超能力!强力升级!影驰RTX 40 SUPER系列显卡盛大推出2024年刚过,新年过后的第一份惊喜即将到来!影驰即将推出全新GeForceRTX40SUPER系列显卡,为各位小伙伴带来重量级的产品,让大家振奋不已!这款显卡...
-
12-20英伟达宣布 CES 2025 特别演讲日程:聚焦生成式 AI 等议题英特尔今日宣布,将参加于2024年1月9日至1月13日举办的CES2024,并计划在北京时间1月9日凌晨0点进行线上NVIDIACES2024特别演讲英伟达将在...

