新闻中心
-
02-07817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式上海交大最新研究颠覆传统认知:只需817个样本,AI数学推理能力即可超越众多顶尖模型!这项名为LIMO(LessIsMoreforReasoning)的研究成果...
-
02-05ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2中科院自动化所提出高效三维场景重建算法CityGaussianV2,攻克大规模场景重建难题!AIxiv专栏持续报道全球顶尖AI研究成果,CityGaussian...
-
02-01ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型PolaFormer:一种极性感知线性注意力机制,赋能高效视觉TransformerAIxiv专栏持续报道全球顶尖AI研究成果,本文介绍哈尔滨工业大学(深圳)与...
-
02-01奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek奥特曼能不急吗?被DeepSeek狂轰乱炸了一周后,终于在今天发布了新的模型o3-mini。此次发布,o3-mini包含low、medium和high三个版本。...
-
01-30ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B基于探索驱动的大模型对齐方法COPO:赋予LLM探索能力,突破性能边界AIxiv专栏持续报道全球顶尖AI研究成果。如果您有优秀的研究成果,欢迎投稿至liyazh...
-
01-27执行推理时能对齐语言模型吗?谷歌InfAlign带来一种对齐新思路GoogleDeepMind和GoogleResearch联合发表的论文提出了一种名为InfAlign(推理感知型对齐)的新框架,旨在优化生成式语言模型在特定推...

