新闻中心
-
04-08除了Transformer架构,还有哪些常用的大模型架构常见大模型架构多样。RNN 处理序列,却因梯度问题难应对长序列;其变体 LSTM 借门控机制改善,GRU 则简化结构提效率。CNN 从计算机视觉起步,借卷积等提...
-
03-25MoshiVis— Kyutai 开源的多模态实时语音模型MoshiVis:一款开源多模态语音模型,赋能语音与视觉交互Kyutai推出的开源多模态语音模型MoshiVis,在实时对话语音模型Moshi的基础上,集成了视...
-
03-05上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了AIxiv专栏:探索MoM:混合记忆模型,兼顾强大的记忆扩展能力和低序列复杂度AIxiv专栏持续关注并报道全球顶尖AI学术研究和技术进展,至今已发布超过2000...
-
02-27无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了AIxiv专栏:探索无编码器架构在3D大型多模态模型中的潜力AIxiv专栏持续报道全球顶尖AI研究成果,已收录2000余篇来自高校和企业实验室的学术技术文章。欢...
-
02-19撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开月之暗面发布MoBA注意力机制,高效处理超长文本!近日,月之暗面团队公开了一种名为MoBA(MixtureofBlockAttention,块注意力混合)的全新...
-
01-14中国科学院可重构异质结光电晶体管的三维信息感知系统研制取得新进展三维信息感知技术在机器视觉、深空探测和医疗影像等领域展现出巨大潜力。然而,现有的三维感知系统通常依赖主动光源或多目相机,导致系统复杂且成本高昂,限制了其微型化发...

