新闻中心
-
08-09通义千问开源Qwen2-Math,成为最先进的数学专项模型8月9日消息,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开...
-
08-06算法、系统和应用,三个视角全面读懂混合专家(MoE)LLM很强,而为了实现LLM的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型...
-
07-26英伟达对话模型ChatQA进化到2.0版本,上下文长度提到128K开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340...
-
07-22机器人版的「斯坦福小镇」来了,专为具身智能研究打造首个专为各种机器人设计的模拟互动3D社会。还记得斯坦福的AI小镇吗?这是斯坦福的AI研究者打造的一个虚拟环境。在这个小镇上,25个AI智能体正常生活、工作、社交...
-
07-19贾佳亚团队联手剑桥清华等共推评测新范式 一秒侦破大模型“高分低能”颠覆过往大模型评测标准,最新、最全、最权威的测评数据集MR-Ben来了!这是继今年4月发布堪称GPT-4+DALL-E-3的王炸产品超强视觉语言模型Mini-G...
-
07-157B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

