新闻中心
-
06-26multimodal模型如何识别图像 图像分析功能教学Multimodal模型能够识别并分析图像,其原理是精妙地结合了计算机视觉与自然语言处理技术。本文将详细拆解这一过程,通过分步讲解模型如何从接收像素数据到最终生...
-
06-18DreamActor-H1— 字节跳动推出的产品演示视频生成框架DreamActor-H1介绍DreamActor-H1是由字节跳动研发的一种基于扩散变换器(DiffusionTransformer,DiT)的新型框架,能够...
-
06-15Next-Frame Diffusion— 北大联合微软推出的自回归视频生成模型Next-FrameDiffusion(NFD)是由北京大学与微软研究院共同研发的自回归视频生成模型,它融合了扩散模型在生成质量上的优势以及自回归模型在因果性和...
-
06-11PartCrafter— AI 3D生成模型,支持多部件联合生成PartCrafter是一款创新的3D生成模型,能够从单张RGB图像中生成多个语义清晰、几何结构多样的3D网格。该模型通过组合潜在空间中的表示来描述每个3D部件...
-
05-28Direct3D-S2— 南大联合复旦等高校推出的高分辨率3D生成框架Direct3D-S2是什么Direct3D-S2是由南京大学、DreamTech、复旦大学以及牛津大学的研究团队联合推出的一种高精度三维生成框架,它以稀疏体积...
-
05-23BAGEL— 字节跳动开源的多模态基础模型BAGEL是什么BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图...

