新闻中心
-
07-21Paddle2.0案例: 人脸关键点检测在图像处理中,关键点本质上是一种特征。它是对一个固定区域或者空间物理关系的抽象描述,描述的是一定邻域范围内的组合或上下文关系。它不仅仅是一个点信息,或代表一个位...
-
07-18浅析 Swin Transformer本文围绕Swin Transformer展开,介绍其作为通用视觉骨干网,采用层次化结构与移位窗口机制提升效率。解读其解决CV挑战的创新点,展示代码构造,包括ML...
-
07-18基于 Paddle2.0 实现 DLA 模型本文介绍了Deep Layer Aggregation(DLA)模型,将聚合定义为网络不同层的组合,提出深度可聚合结构,通过迭代深层聚合(IDA)和分层深度聚合...
-
07-18FF Only:Attention真的需要吗?本文复现去attention化论文,以Feed-Forward替代Transformer的attention层,基于ViT、DeiT模型在ImageNet表现良...
-
07-18Paddle2.0:浅析并实现 FcaNet 模型FcaNet通过频率域分析重新审视通道注意力,证明GAP是二维DCT的特例。据此将通道注意力推广到频域,提出多谱通道注意力框架,通过选择更多频率分量引入更多信息...
-
07-18浅析并实现 CycleMLP,一种用于密集预测的类 MLP 模型CycleMLP是用于视觉识别和密集预测的通用主干,相较MLP Mixer等模型,能处理不同图像大小,以线性计算复杂度实现局部窗口操作。其核心是Cycle FC...

