新闻中心
-
02-02匿名论文提出奇招!增强大模型长文本能力居然还能这么做一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参...
-
02-01纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么?最近,麻省理工学院计算机科学与人工智能...
-
01-24变分自动编码器:理论与实现方案变分自动编码器(VAE)是一种基于神经网络的生成模型。它的目标是学习高维数据的低维潜在变量表示,并利用这些潜在变量进行数据的重构和生成。相比传统的自动编码器,V...
-
01-22AI视频生成框架测试竞争:Pika、Gen-2、ModelScope、SEINE,谁能胜出?AI视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头AILab、创业公司纷纷加入了AI视频生成的赛道。Pika、Gen-2、Show-1、Video...
-
01-16利用PyTorch实现混合专家模型(MoE)Mixtral8x7B的推出在开放AI领域引起了广泛关注,特别是混合专家(Mixture-of-Experts:MoEs)这一概念被大家所熟知。混合专家(MoE...
-
01-15字节新一代视频生成模型,让*戴上VR眼镜的效果更胜Gen-2!一句话,就让绿巨人戴上VR眼镜。4K画质那种。熊猫的奇幻漂流~这是字节最新的AI视频生成模型MagicVideo-V2,各种奇思妙想的想法都能实现。它不仅支持4...

