新闻中心
-
08-01基于PaddlePaddle2.0-构建门控循环单元模型陆平在文中介绍基于PaddlePaddle2.0构建门控循环单元(GRU)模型的流程,GRU通过重置门与更新门选择性记忆时序信息,并给出相关公式。还以IMDB电...
-
07-31HorNet: 高效的空间交互模块本文提出递归门控卷积(gnConv),它通过门控卷积核递归设计执行高效、可扩展和平移等变的高阶空间交互,即插即用来改进各种视觉Transformer和基于CNN...
-
07-31【ICLR 2025】MogaNet: 高效多阶门控聚合网络MogaNet是高效多阶门控聚合网络,属纯卷积架构。其通过SMixer和CMixer模块,在空间和通道交互中促进多阶交互并情境化,平衡复杂度与性能。在Image...
-
07-30『零基础+1』一文看懂LSTM原理-《动手学深度学习》长短期记忆网络(LSTM)为解决隐变量模型的长期信息保存与短期输入缺失问题而设计,含记忆元及输入门、遗忘门、输出门三个门控机制,通过特定计算控制信息留存更新。文...
-
07-29Qwen3-235B-A22B-Thinking-2507— 阿里推出的最新推理模型Qwen3-235B-A22B-Thinking-2507是什么Qwen3-235B-A22B-Thinking-2507是阿里巴巴推出的全球领先的开源推理模型...
-
07-29基于PaddlePaddle2.0-构建长短期记忆网络本文介绍用PaddlePaddle2构建长短期记忆网络模型。先讲引入时间步的单隐藏层、多隐藏层模型,说明隐藏层输出与输入及前一时间步输出的关系;再阐述长短期记忆...

