新闻中心
-
03-19COMET— 字节开源的通信优化系统字节跳动推出COMET:高效MoE模型训练优化系统COMET是字节跳动为解决Mixture-of-Experts(MoE)模型分布式训练中的高通信开销问题而开发...
-
03-18AI大模型“竞速跑” 头部企业加快迭代上新百度、阿里巴巴、零一万物等AI巨头近期动作频频,纷纷加速AI大模型迭代升级,推出全新AI应用,并积极推动开源进程,在人工智能创新赛道上展开激烈竞争,力求优化用户...
-
03-11大模型全军覆没,中科院自动化所推出多图数学推理新基准近日,中国科学院自动化研究所推出多图数学推理全新基准MV-MATH(该工作已被CVPR2025录用),这是一个精心策划的多图数学推理数据集,旨在全面评估MLLM...
-
03-05为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理深度解析:大模型的自我改进能力为何参差不齐?斯坦福大学最新研究揭秘近期,斯坦福大学的一项研究深入探讨了大型语言模型(LLM)自我改进能力背后的机制,解释了为何有...
-
03-05视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源重磅推荐:Visual-RFT——视觉强化微调开源项目,赋能视觉语言模型!AIxiv专栏持续关注全球顶尖AI研究,已发布2000余篇学术技术文章。欢迎投稿分享您...
-
03-03开源仅6天,阿里万相大模型登上全球开源榜首阿里万相大模型开源仅6天,便在HuggingFace社区力压群雄,荣登模型热榜和模型空间榜榜首,成为近期全球最受瞩目的开源大模型。其在HuggingFace和魔...

