新闻中心
-
04-17用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM多任务机器人学习在应对多样化和复杂情景方面具有重要意义。然而,当前的方法受到性能问题和收集训练数据集的困难的限制。这篇论文提出了GeRM(通用机器人模型),研究...
-
04-17清华团队推出新平台:用去中心化AI打破算力荒最近,一则数据点出了AI领域算力需求的惊人增长——根据业内专家的预估,OpenAI推出的Sora在训练环节大约需要约4200-10500张NVIDIAH100上...
-
04-17谷歌出手整顿大模型“健忘症”!反馈注意力机制帮你“更新”上下文,大模型无限记忆力时代将至编辑|伊风出品|51CTO技术栈(微信号:blog51cto)谷歌终于出手了!我们将不再忍受大模型的“健忘症”。TransformerFAM横空出世,放话要让大...
-
04-16清华最新!RoadBEV:BEV下的道路表面重建如何实现?原标题:RoadBEV:RoadSurfaceReconstructioninBird’sEyeView论文链接:https://arxiv.org/pdf/2...
-
04-15一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法神经网络作为深度学习技术的基础已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,确立网络训练...
-
04-11探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架基于大模型的持续优化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦...

