新闻中心
-
08-29OmniHuman-1.5— 字节推出的数字人动画生成模型OmniHuman-1.5是什么OmniHuman-1.5是由字节跳动推出的一款前沿AI模型,能够基于单张静态图像和一段语音,自动生成具有高度表现力的数字人动画...
-
08-06Qwen-Image— 阿里通义千问开源的文生图模型Qwen-Image是什么Qwen-Image是由阿里通义千问团队推出的开源200亿参数MMDiT图像生成模型,作为通义千问系列首款专注于视觉生成的基础模型,它...
-
08-03FLUX.1 Krea [dev]— 黑森林联合Krea AI开源的文生图模型FLUX.1Krea[dev]是什么FLUX.1Krea[dev]是由BlackForestLabs联合KreaAI共同开发的最新文本生成图像模型,致力于打造更...
-
07-31表格学习:基于飞桨复现TabNet网络本文基于PaddlePaddle复现TabNet网络,该网络可处理表格数据,支持端到端学习,通过顺序注意实现特征选择与可解释性。复现项目在Forest Cove...
-
07-16【CVPRW 2025】MobileViG:用于移动视觉应用的基于图的稀疏注意力该代码复现了MobileViG模型,这是一种混合CNN-GNN架构。代码先下载导入库,创建并处理Cifar10数据集,接着实现标签平滑、DropPath等组件,...
-
07-03MirrorMe— 阿里通义推出的音频驱动肖像动画框架MirrorMe简介MirrorMe是通义实验室推出的实时音频驱动肖像动画框架,具备高保真特性。该框架依托LTX视频模型,融合三项核心技术:身份注入机制、音频驱...

