新闻中心
-
01-18AI 视频生成论坛即将开幕!参会指南请查收「视频生成前沿研究与应用」本站AI技术论坛将于本周六(1月20日)正式开启。本次活动是2024年本站主办的首场线下交流活动,期待到场的朋友们都能收获满满。为了帮...
-
01-18深度学习在几何推理上获得天才级表现,Nature发表了DeepMind的模型,并于菲尔兹奖得主新闻中获得赞誉这项工作代表了AI在数学推理上的能力突破,是开发通用AI系统方面的重要里程碑。这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。在最新一期的...
-
01-18Lightning Attention-2:实现无限序列长度、恒定算力成本和更高建模精度的新一代注意力机制LightningAttention-2是一种新型的线性注意力机制,让长序列的训练和推理成本与1K序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工...
-
01-17蚂蚁集团发布新算法,可加快大型模型推理速度2-6倍近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加...
-
01-16无条件免费商用的全球最长开源模型XVERSE-Long-256K元象发布了全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K。这个模型支持输入25万汉字,使得大模型应用能够进入“长文本时代”。该模型完...
-
01-16上交大发布推理引擎PowerInfer,其token生成速率仅比A100低18%,或将取代4090成为A100的替代品为了不改变原意而重写内容,需要将语言重写为中文,不需要出现原句本网站的编辑部PowerInfer的出现使得在消费级硬件上运行AI变得更加高效上海交大团队,刚刚推...

