新闻中心
-
09-13HuMo— 清华联合字节推出的多模态视频生成框架HuMo是什么HuMo是由清华大学与字节跳动智能创作实验室联合研发的一种面向人类主体的多模态视频生成框架。该框架能够基于文本、图像和音频等多种输入模态,生成高保...
-
09-07FineVision— Hugging Face开源的视觉语言数据集FineVision是什么FineVision是由HuggingFace推出的一个开源视觉语言数据集,旨在训练更先进的视觉语言模型。该数据集包含1730万张图像...
-
09-03HunyuanWorld-Voyager— 腾讯推出的超长漫游世界模型HunyuanWorld-Voyager是什么HunyuanWorld-Voyager(又称混元Voyager)是腾讯推出的全球首个支持原生3D重建的超长距离场...
-
09-02Step-Audio 2 mini— 阶跃星辰开源的端到端语音大模型Step-Audio2mini是由阶跃星辰推出的开源端到端语音大模型。该模型打破传统语音处理的层级架构,采用真正的端到端多模态设计,能够直接将原始音频输入转化为...
-
08-31如何用PyTorch训练AI大模型?构建高效神经网络的完整教程PyTorch大模型训练需综合运用分布式训练、内存优化与高效计算策略。首先采用DistributedDataParallel实现多GPU并行,配合Distrib...
-
08-31如何使用FastAI训练AI大模型?快速构建高效模型的实用方法FastAI的核心价值在于通过高级API和优化策略简化大模型微调流程。它依托预训练模型(如ResNet、BERT)实现高效迁移学习,利用fine_tune方法自...

