新闻中心
-
08-28VibeVoice— 微软推出的开源文本转语音模型VibeVoice是什么VibeVoice是微软最新推出的文本到语音(TTS)模型,能够生成具有丰富情感、支持多位说话者、适用于长篇内容的自然对话音频,例如播客...
-
08-28WhisperLiveKit— 开源AI语音识别工具,支持说话人识别WhisperLiveKit是什么WhisperLiveKit是一款开源的实时语音识别解决方案,能够将语音流即时转换为文字,同时支持说话人区分功能。该工具融合了...
-
08-24打游戏时开麦队友听不到我声音怎么办?首先检查麦克风硬件连接是否正确,再确认系统和游戏内麦克风设置无误,排除驱动、权限及后台程序冲突问题,若其他程序可用则可能是游戏设置或兼容性问题,通过调整采样率或...
-
08-06蝉镜如何实现语音转文字?会议记录功能指南蝉镜的语音转文字准确率在理想条件下可达95%以上,但受音频质量、发言人口音与语速、专业术语使用及多人交叉发言等因素影响;1.音频质量差会显著降低识别效果;2.口...
-
07-31[语音分类入门]基于PaddleSpeech和LSTM网络的双城之战人物语音分类本项目为音频分类入门教程,基于Paddle API展开。先讲解音频基础知识,包括本质、三要素、格式及处理概念;再介绍短时傅里叶变换和LogFBank等特征提取方...
-
07-28【PaddlePaddle+OpenVINO】AI“朗读机”诞生记本文介绍了基于Paddle模型库在Intel AI BOX边缘设备上部署简易AI“朗读机”的项目。该设备可识别实体书或A4纸文字,按空格键即可发声并截图。部署涉...

