新闻中心
-
06-26OmniAvatar— 浙大联合阿里推出的音频驱动全身视频生成模型OmniAvatar是一款由浙江大学和阿里巴巴集团联合研发的音频驱动全身视频生成模型。该模型能够根据输入的音频和文本提示,生成逼真且自然的全身动画视频,人物动作...
-
06-25iOS17.5升级后Apple Watch有哪些新功能随着iOS17.5的正式发布,AppleWatch用户也迎来了许多令人振奋的新变化。这次更新不仅在功能上进行了改进,还在用户体验方面进行了多项优化。让我们一起来...
-
06-19实测字节扣子空间:AI 播客比真人丝滑,Agent 能打 80% 的工上个月,字节跳动旗下的Agent「扣子空间」刚上线时,曾因用户量激增而导致服务器一度被挤爆,全网都在疯传内测码。经过一个月的发展,AI科技评论发现扣子空间最新推...
-
06-12Vui— Fluxions-AI开源的轻量级语音对话模型Vui是什么Vui是由Fluxions-AI团队推出的开源轻量语音对话模型,构建于LLaMA架构之上。该模型经过4万小时的对话训练,能够模拟真实对话中的语气词、...
-
06-06OpenAudio S1— Fish Audio推出的新一代语音生成模型OpenAudioS1是什么OpenAudioS1是FishAudio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双...
-
06-06MoonCast— 零样本AI播客生成系统,合成自然的播客风格MoonCast是什么MoonCast是零样本播客生成系统,从纯文本源合成自然的播客风格语音。通过长上下文语言模型和大规模语音数据训练,能生成几分钟长的播客音频...

