新闻中心
-
02-16语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS随着生成式深度学习模型的快速发展,自然语言处理(NLP)和计算机视觉(CV)已经发生了重大变革。从以前需要专门训练的监督模型,转变为只需要简单明确的指令就能完成...
-
01-22声音切割什么是语音分割语音分割是将语音信号分解成更小的、有意义的语音单元的过程。一般来说,连续的语音信号会被分割成单词、音节或语音段等。语音分割是语音处理任务中的基础,...
-
01-22Attention机制的算法及其应用Attention机制是一种关键的序列数据处理算法,其主要目标是为序列中的每个元素分配权重,以便在计算输出时考虑它们的相对重要性。这种机制在自然语言处理、图像处...
-
01-092025年ICASSP|字节跳动流媒体音频团队创新解方案:解决丢包补偿和通用音质修复问题在本届ICASSP2024各类音频国际挑战赛中,字节跳动流媒体音频团队联合西北工业大学音频语音与语言处理研究实验室,在丢包补偿(PacketLossConcea...
-
01-03薛定谔桥助力,清华朱军团队开发新型语音合成系统应对扩散挑战近日,由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统[1],凭借其「数据到数据」的生成范式,在样本质量和采样速度两方面,均击败了扩散模型的「噪...
-
11-26快速建立大型语言模型AI知识库,仅需三分钟FastGPTFastGPT是一个使用LLM大语言模型构建的知识库问答系统,可以提供即插即用的数据处理和模型调用功能。同时,它还支持通过Flow可视化工作流编排...

