新闻中心
-
09-19InternVLA-A1— 上海AI实验室开源的具身操作大模型InternVLA-A1是什么InternVLA-A1是上海人工智能实验室和国家地方共建人形机器人创新中心联合发布的具身操作大模型。具备理解、想象、执行一体化的...
-
09-19昆仑万维上线Mureka V7等模型,MusiCoT技术让AI音乐创作大升级近日,昆仑万维正式上线最新音乐模型MurekaV7,以及全新的音频模型MurekaTTSV1。此前,MurekaO1模型与MurekaV6模型自3月底发布后,收...
-
09-17Lumina-DiMOO— 上海AI Lab推出的多模态生成与理解模型Lumina-DiMOO是什么Lumina-DiMOO是由上海人工智能实验室等单位联合推出的开源新一代多模态生成与理解模型。该模型采用全离散扩散架构,能够统一处...
-
09-13HuMo— 清华联合字节推出的多模态视频生成框架HuMo是什么HuMo是由清华大学与字节跳动智能创作实验室联合研发的一种面向人类主体的多模态视频生成框架。该框架能够基于文本、图像和音频等多种输入模态,生成高保...
-
09-06OneCAT— 美团联合上交大推出的统一多模态模型OneCAT简介OneCAT是美团发布的一款先进的统一多模态人工智能模型,基于纯解码器架构构建,集成了多模态理解、文本到图像生成以及图像编辑等多项能力。该模型突...
-
09-05智能助手怎么处理多模态任务_AI理解图片语音和文本方法多模态智能助手通过多模态嵌入、注意力机制、Transformer架构和对比学习等技术,将图像、语音和文本统一表示并关联,实现跨模态理解与响应;实际应用中面临数据...

