新闻中心
-
07-22中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-22ICML 2025 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-19华为GTS LocMoE+:高可扩展性亲和度 MoE 架构,低开销实现主动路由AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-19贾佳亚团队联手剑桥清华等共推评测新范式 一秒侦破大模型“高分低能”颠覆过往大模型评测标准,最新、最全、最权威的测评数据集MR-Ben来了!这是继今年4月发布堪称GPT-4+DALL-E-3的王炸产品超强视觉语言模型Mini-G...
-
07-18OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获...
-
07-18ACL 2025 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

