新闻中心
-
09-19VALL-E添加AI视频解说情感语音_VALL-E为AI视频解说添加情感语音详解VALL-E是微软推出的零样本语音合成模型,能通过3秒语音片段模仿语调、情感和音色,生成拟人化语音。它基于大规模数据训练,具备上下文理解与情感表达能力,支持喜悦...
-
02-16语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS随着生成式深度学习模型的快速发展,自然语言处理(NLP)和计算机视觉(CV)已经发生了重大变革。从以前需要专门训练的监督模型,转变为只需要简单明确的指令就能完成...
-
06-21Meta发布音频AI模型,仅需2秒片段模拟真人语音近日,Meta发布了VoiceboxAI模型,它在音频模拟方面有着显著优势。据悉,Voicebox只需要一段2秒钟的音频样本,即可准确辨别出音频细节、音色,并基...
-
共1页 3条

