新闻中心
-
03-11Pika推出音画同步新功能一天后,翻车视频来了Pika的音效新功能「SoundEffects」,有大大的惊喜,也有小小的「惊吓」。Sora的出现让文生视频模型及应用火了起来。不过,此类模型生成的视频大多数都...
-
03-11零一万物自研全导航图向量数据库,横扫权威榜单6项第一3月11日,零一万物宣布推出基于全导航图的新型向量数据库「笛卡尔(Descartes)」,已包揽权威榜单ANN-Benchmarks6项数据集评测第一名。向量数...
-
03-11基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了这个模型和Sora一样采用了DiT框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC(...
-
03-06ICLR 2025 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net视听语音分离(AVSS)技术的主要目的是在混合信号中识别并分离出目标说话者的声音,利用面部信息来实现这一目标。这项技术在多个领域都有广泛的应用,包括智能助手、远...
-
03-06百度Comate开放插件生态,智能代码助手定制化时代来临3月1日,百度旗下智能代码助手BaiduComate又添两大重磅能力:“Comate+”开放平台、AutoWork“私人研发助理”,为行业首家免费开放试用。本次...
-
03-05ICLR 2025 Oral:长视频中噪声关联学习,单卡训练仅需1天在2024世界经济论坛的一次会谈中,图灵奖得主YannLeCun提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间[1]。借助文本信...

