新闻中心
-
03-13颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源作为Sora引人注目的核心技术之一,DiT利用DiffusionTransformer将生成模型扩展到更大的规模,从而实现出色的图像生成效果。然而,更大的模型规...
-
03-12被误解的「中文版Sora」背后,字节跳动有哪些技术?2024开年,OpenAI就在生成式AI领域扔下了重磅炸弹:Sora。这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关技术进展和落地成果。在此之...
-
03-11Pika推出音画同步新功能一天后,翻车视频来了Pika的音效新功能「SoundEffects」,有大大的惊喜,也有小小的「惊吓」。Sora的出现让文生视频模型及应用火了起来。不过,此类模型生成的视频大多数都...
-
03-11基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了这个模型和Sora一样采用了DiT框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC(...
-
03-11Pika放大招:今天起,视频和音效可以“一锅出”了!就在刚刚,Pika发布了一项新功能:很抱歉我们之前一直处于静音状态。今天起,大家可以给视频无缝生成音效了——SoundEffects!生成的方式有两种:要么给一...
-
03-07全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA半年多来,Meta开源的LLaMA架构在LLM中经受了考验并大获成功(训练稳定、容易做scaling)。沿袭ViT的研究思路,我们能否借助创新性的LLaMA架构...

