新闻中心
-
11-265%的AI企业落地成功者到底做对了什么?大家都看过之前那份令人担忧的报告:95%的企业级AI项目以失败告终。然而,如果我们不执着于那95%的失败率,而是将目光转向那仅占5%却成功落地AI的企业,深入探...
-
11-26深入解析 PyPTO Operator:以 DeepSeek‑V3.2‑Exp 模型为例的实战指南前言在如今的大模型部署世界里,大家讨论得最多的往往是模型本身:参数规模、上下文长度、推理速度、吞吐表现……但只要真正踩过一次从“模型参数”到“实际落地推理服务”...
-
11-26构建AI智能体:语言模型的“解码策略”:一文读懂AI文本生成的采样方法一、开篇导语不知道大家有没有刷到过一个趣味玩法,在输入法的文本框以一个什么字开头,一直按下一个下一个,可以生成一句看似完整且有趣的话,这是最早期的通过键盘记忆...
-
11-26【大模型后训练学习】DPO与GRPO专题学习前言✍前面几章我们已经把“大模型架构四件套”(GQA/RoPE/SwiGLU/RMSNorm)和DeepSeek系列摸了个大概,知道了一个LLM从参数形状到注意...
-
11-26【大模型学习】现代大模型架构(二):旋转位置编码和SwiGLURoPE/SwiGLU前言✍上一篇我们把现代大模型的两件“基础设施”——GQA注意力和RMSNorm+Pre-Norm细讲了一遍,从多头注意力的演化一路讲到归一...
-
11-26强化学习系列(十二)--GRPO,DAPO,DUPO,GSPO在之前的强化学习系列中我们介绍了强化学习的基础知识,也在系列十和系列十一中介绍了强化学习RL在LLM中的应用。最近我在介绍DeepResearchAgent的论...

