流式_第10页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

04-07

OmniTalker— 阿里推出的实时文本驱动说话头像生成框架

阿里巴巴推出的OmniTalker，是一款基于实时文本驱动的说话头像生成技术。它能够流畅处理文本、图像、音频和视频等多种模态信息，并以流式方式生成自然逼真的语音...
03-28

Qwen2.5-Omni— 阿里开源的端到端多模态模型

阿里巴巴开源的Qwen2.5-Omni：一款70亿参数的旗舰级多模态模型Qwen2.5-Omni是阿里云最新发布的开源多模态大型语言模型，拥有70亿参数，在多模...
03-22

Orpheus TTS— 开源AI语音合成系统，支持多种语音风格

OrpheusTTS是什么OrpheusTTS是基于Llama-3b架构的开源文本到语音（TTS）系统。OrpheusTTS支持生成自然、富有情感且接近人类水平...
03-19

Chirp 3— 谷歌云推出的高清语音合成模型

谷歌云推出全新高清语音合成模型：Chirp3Chirp3是谷歌云重磅推出的高清语音合成模型，旨在生成逼真、自然的语音。它支持31种语言和248种不同音色，能够细...
03-19

LanDiff— 高质量文本到视频生成的混合框架

LanDiff：革新文本转视频技术LanDiff是一个突破性的文本转视频(T2V)生成框架，它巧妙地融合了自回归语言模型(LLM)和扩散模型(Diffusion...
03-19

LangManus— AI自动化框架，多智能体协同完成复杂任务

LangManus：一个基于多智能体系统的AI自动化框架LangManus是一个先进的AI自动化框架，其核心设计理念是分层多智能体系统。它由多个智能体协同工作，...

: 电话

: 客服

: 地图

: 搜索