新闻中心
-
11-30陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流阿里云通义千问团队最新发布的开源AI推理模型QwQ-32B,在AI数学奥林匹克竞赛AIMO中表现惊艳,展现出强大的数学和编程能力,甚至在部分测试中超越了Open...
-
11-27Scaling Law 撞墙?复旦团队大模型推理新思路:Two-Player架构打破自我反思瓶颈AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-26陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销现在,大语言模型的结构化生成有了一个更加高效、灵活的引擎。不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要LLM生成结构化数...
-
11-24这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct开源模型阵营又迎来一员猛将:Tülu3。它来自艾伦人工智能研究所(Ai2),目前包含8B和70B两个版本(未来还会有405B版本),并且其性能超过了Llama3...
-
11-22上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
11-20阿里云百炼上线百万长文本模型Qwen2.5 -Turbo,百万tokens仅需0.3元11月20日消息,阿里云推出最新升级的Qwen2.5-Turbo模型,现已上线百炼平台。这款模型拥有100万超长上下文处理能力,相当于100万个英文单词或150...

