新闻中心
-
06-18FlowDirector— 西湖大学联合中南大学推出的视频编辑框架FlowDirector是由西湖大学AGILab团队与中南大学合作开发的一种无需训练(training-free)的视频编辑框架,旨在通过自然语言指令实现对视频...
-
06-18DreamActor-H1— 字节跳动推出的产品演示视频生成框架DreamActor-H1介绍DreamActor-H1是由字节跳动研发的一种基于扩散变换器(DiffusionTransformer,DiT)的新型框架,能够...
-
06-17MAGREF— 字节跳动推出的多主体视频生成框架MAGREF(MaskedGuidanceforAny‑ReferenceVideoGeneration)是由字节跳动开发的多主体视频生成框架。该框架只需一张参...
-
06-11MaskSearch— 阿里通义推出的检索增强预训练框架MaskSearch是什么MaskSearch是由阿里巴巴通义实验室开发的一种全新通用预训练框架,旨在增强大型语言模型(LLM)的智能搜索能力。该框架通过引入检...
-
06-05PlayDiffusion— Play AI开源的音频编辑模型PlayDiffusion是什么PlayDiffusion是PlayAI推出的新型音频编辑模型,基于扩散模型技术,专门用在音频的精细编辑和修复。模型将音频编码为...
-
06-05OmniAudio— 阿里通义推出的空间音频生成模型OmniAudio是什么OmniAudio是阿里巴巴通义实验室语音团队推出的从360视频生成空间音频(FOA)的技术。为虚拟现实和沉浸式娱乐提供更真实的音频体验...

