新闻中心
-
07-18基于 Paddle2.0 实现 DLA 模型本文介绍了Deep Layer Aggregation(DLA)模型,将聚合定义为网络不同层的组合,提出深度可聚合结构,通过迭代深层聚合(IDA)和分层深度聚合...
-
07-18ConViT:引入归纳偏置的ViT本文复现了ConViT模型,其通过GPSA模块将CNN的归纳偏置引入ViT。代码用Paddle实现,包含网络结构搭建、模型定义等。在Cifar10数据集验证,因...
-
07-18Paddle2.0:浅析并实现 CoaT 模型本文介绍基于Transformer的图像分类器CoaT,其含Co-Scale和Conv-Attentional机制,能为Vision Transformer提供...
-
07-18Paddle2.0:浅析并实现 LV-ViT 模型本文探索提升ViT性能的训练技巧,提出LV-ViT模型。其改进包括增加网络深度、显式引入归纳偏置、改进残差连接、采用Re-labeling和Token Labe...
-
07-18Paddle2.0:浅析并实现 T2T-ViT 模型T2T-ViT提出渐进式Token化机制和深窄骨干结构,在ImageNet从头训练,超越CNN与ViT,参数和MAC减少200%,性能更优,如T2T-ViT-7...
-
07-18FF Only:Attention真的需要吗?本文复现去attention化论文,以Feed-Forward替代Transformer的attention层,基于ViT、DeiT模型在ImageNet表现良...

