新闻中心
-
11-22上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-20阿里云百炼上线百万长文本模型Qwen2.5 -Turbo,百万tokens仅需0.3元11月20日消息,阿里云推出最新升级的Qwen2.5-Turbo模型,现已上线百炼平台。这款模型拥有100万超长上下文处理能力,相当于100万个英文单词或150...
-
11-20媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-19大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」去掉一个「超权重」的影响,比去掉其他7000个离群值权重加起来还要严重。大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。两年前,有研究者发现了一些古怪...
-
11-19NeurIPS 2025 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-17突破无规则稀疏计算边界,编译框架CROSS数倍提升模型性能AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

