新闻中心
-
08-07小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++在当前AI领域,大语言模型采用的主流架构是Transformer。不过,随着RWKV、Mamba等架构的陆续问世,出现了一个很明显的趋势:在语言建模困惑度方面与...
-
08-05延迟交互模型,为什么是下一代RAG的标配?AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-0570倍极致压缩!大模型的检查点再多也不怕AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-31ICML 2025|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-31揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad...
-
07-26突破传统缺陷检测的界限,"Defect Spectrum"首次实现超高精度丰富语义的工业缺陷检测。在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法...

