新闻中心
-
07-09单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速微软的这项研究让开发者可以在单卡机器上以10倍的速度处理超过1M的输入文本。大型语言模型(LLM)已进入长上下文处理时代,其支持的上下文窗口从先前的128K猛增...
-
06-29谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!性能翻倍的Gemma2,让同量级的Llama3怎么玩?AI赛道上,科技巨头们激烈角逐。前脚有GPT-4o问世,后脚就出现了Claude3.5Sonnet。如此激...
-
06-29Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-26OpenAI停服,国产大模型免费用!开发者Token自由实现了今天凌晨,OpenAI突然宣布终止对中国提供API服务,进一步收紧国内开发者访问GPT等高水平大模型。国内开发者真是太难了。好在,随着开源大模型水平越来越高,开...
-
06-24奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-21从高考到奥林匹克竞技场:大模型与人类智能的终极较量AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

