新闻中心
-
09-19参数量超1万亿!通义千问新模型Qwen3-Max性能领先引期待近日,阿里巴巴旗下通义千问Qwen上线新模型Qwen3-Max-Preview(Instruct)。官方宣称,“这是我们迄今为止最大的模型,参数量超1万亿!”参...
-
09-19DeepSeek GRPO或致模型崩溃,Qwen3新范式GSPO能否成新标准?大型语言模型的训练一般分为“预训练”和“后训练”两个阶段。“预训练”阶段,开发者借助大规模文本数据集对模型进行训练,使其学会预测句子中的下一个词;“后训练”阶段...
-
09-19GitHub推出Spark:AI驱动全栈开发,从创意到上线仅需几分钟!近日,GitHub正式推出了一款具有里程碑意义的开发工具——GitHubSpark,并宣布其公共预览版现已面向CopilotPro+订阅用户开放。该工具声称可将...
-
09-19智谱旗舰模型GLM - 4.5发布,成本低性能优,相关企业或迎风口近日,智谱正式发布并开源其旗舰级大模型GLM-4.5。这是国内首款实现SOTA(当前最优)性能的原生智能体大模型,在多项国产综合评测中位列第一,整体表现可与全球...
-
09-19马斯克开源Grok - 2硬件门槛高引争议,中国AI优势凸显被看好近日,马斯克在社交平台X宣布,xAI公司的Grok-2正式开源,模型权重与架构已托管至HuggingFace。此消息一出,瞬间在AI领域引发热议,大家纷纷探讨这...
-
09-19年入数千万美元估值超30亿,AI编程独角兽为何越做越亏?一个个看似风光无限的AI编程企业,实则深陷亏损漩涡。这种表面繁荣与实际财务状况的巨大反差,引发了一个令人深思的问题:为何Windsurf在半年内估值翻倍、年收入...

