新闻中心
-
10-08Ming-UniAudio— 蚂蚁集团开源的音频多模态模型Ming-UniAudio是什么Ming-UniAudio是由蚂蚁集团推出的开源音频多模态模型,旨在统一处理语音理解、生成与编辑任务。其核心技术为MingTok...
-
10-06百度AI技术大会有哪些亮点_百度AI技术大会亮点回顾百度AI开发者大会展示了文心大模型4.5Turbo在多模态融合、智能体开发、数字人NOVA、飞桨生态及萝卜快跑自动驾驶的全面突破,推动AI技术产业化落地。
-
10-05即梦AI多模态生成怎样_即梦AI图文视频融合创作方法优化图文输入结构、调整多模态融合参数、使用模板预设、手动校准时间轴可提升即梦AI生成质量,确保语义一致与音画同步。
-
09-25Qwen3-LiveTranslate— 阿里通义推出的全模态同传大模型Qwen3-LiveTranslate是什么Qwen3-LiveTranslate是由阿里通义实验室推出的一款基于大语言模型的多语言实时音视频同声传译系统。该模...
-
09-24Qianfan-VL— 百度开源的视觉理解模型Qianfan-VL是什么Qianfan-VL是百度智能云千帆推出的一款专为企业级多模态应用打造的视觉理解大模型。该模型提供3B、8B和70B三种参数规模版本,...
-
09-23Qwen3-Omni— 阿里通义开源的原生端到端全模态大模型Qwen3-Omni是什么Qwen3-Omni是由阿里通义实验室推出的全球首个原生端到端全模态AI大模型,具备同时处理文本、图像、音频与视频的能力。该模型在36...

