新闻中心
-
09-23Qwen3-Omni— 阿里通义开源的原生端到端全模态大模型Qwen3-Omni是什么Qwen3-Omni是由阿里通义实验室推出的全球首个原生端到端全模态AI大模型,具备同时处理文本、图像、音频与视频的能力。该模型在36...
-
09-21Codexia— 开源的AI编码桌面应用程序,多会话支持Codexia是什么Codexia是一款功能强大的跨平台AI编程桌面工具,为OpenAICodexCLI提供直观的图形化界面与丰富的辅助功能,显著提升开发者的工...
-
09-13FireRedTTS-2— 小红书推出的流式文本转语音系统FireRedTTS-2是什么FireRedTTS-2是一款先进的长格式流式文本转语音(TTS)系统,专注于高质量的多说话人对话合成。该系统采用12.5Hz的流...
-
08-28WhisperLiveKit— 开源AI语音识别工具,支持说话人识别WhisperLiveKit是什么WhisperLiveKit是一款开源的实时语音识别解决方案,能够将语音流即时转换为文字,同时支持说话人区分功能。该工具融合了...
-
08-04Golang对接TextGen WebUI 本地大语言模型API化教程要使用Golang对接TextGenWebUI本地大语言模型并实现API化,需按照以下步骤操作:1.确保已安装Golang环境并部署好TextGenWebUI;...
-
07-30如何将豆包AI集成到自有系统 豆包AI API调用方式解析集成豆包AI到自有系统的核心在于理解其API接口并进行HTTP请求调用,具体步骤包括:1.获取API凭证并进行认证;2.选择合适的API端点;3.构造JSON格...

