新闻中心
-
03-050.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR最近,文生视频模型Sora掀起了新一轮生成式AI模型浪潮,模型的多模态能力引起广泛关注。现在,AI模型在3D内容生成方面又有了新突破。在成功推出图片生成和视频生...
-
02-29数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好腾讯的研究团队进行了一项关于agent的可拓展性的研究。他们发现,通过简单的采样投票,大型语言模型(LLM)的性能随着实例化agent数量的增加而增强。这项研究...
-
02-04陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好Transformer的技能树是越来越厉害了。来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员,最近发表了一篇论文,他们通过使用大型语...
-
02-02匿名论文提出奇招!增强大模型长文本能力居然还能这么做一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参...
-
01-22什么是交叉熵 交叉熵算法的最小化机器学习和深度学习模型通常用于解决回归和分类问题。在监督学习中,模型在训练过程中学习如何将输入映射到概率输出。为了优化模型的性能,常常使用损失函数来评估预测结果...
-
01-22常用方法:衡量新语言模型的困惑度评估新语言模型的方法有多种,其中一些是基于人类专家的评估,而其他一些则基于自动化评估。这些方法各有优缺点。本文将重点介绍基于自动化评估的困惑度方法。困惑度(Pe...

