新闻中心
-
07-31论文解读一篇关于语义生成论文(要求控制单独语义生成)本文聚焦语义多模态图像合成(SMIS)任务,旨在通过特定类控制器调整对应区域生成图像,且不影响其他部分。针对现有方法局限,提出GroupDNet,利用组卷积并逐...
-
07-31PaddleSeg代码解读-数据增强与模型结构解读本文是PaddleSeg代码解读第二篇,先解读数据增强代码,介绍了transforms中Compose等多个预处理与增强类的实现,它们通过__call__方法运...
-
07-31模型压缩之聚类量化本文围绕模型压缩中的聚类量化展开,先概述模型量化是通过简化参数比特位存储实现压缩。重点介绍Deep Compression的聚类量化思路,包括参数聚类等步骤,还...
-
07-31文字识别:基于PaddlePaddle复现PANet该论文提出PAN网络,以ResNet-18为骨干,结合FPEM、FFM和像素聚合法,平衡场景文本检测的精度与速度。基于Paddle的复现项目,部分数据集F-me...
-
07-31科大讯飞-人脸关键点检测挑战赛:进阶思路预训练模型 MAE 1.2该内容为一场人脸关键点检测竞赛的解决方案。使用5千张带标注的人脸图像训练模型,识别4个关键点。采用ResNet18模型,调整输入层和输出层适配单通道图像及8个坐...
-
07-31【AI达人特训营第三期】Conv2Former:一种ViT风格的卷积模块本文复现了Conv2Former模型,其采用Transformer风格的QKV结构,以卷积生成权重加权,平衡全局信息提取与计算开销。在CIFAR-10数据集上,...

