新闻中心
-
05-30Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练大神Karpathy已经不满足于用C语言造Llama了!他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。挑战成功本身并不意外,但是只花费2...
-
05-27全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐LLM方面,一种有效的方法是根据人类反馈的...
-
05-24HuggingFace教你怎样做出SOTA视觉模型前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。在这篇Hugging...
-
05-24数据更多更好还是质量更高更好?这项研究能帮你做出选择对基础模型进行scaling是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不...
-
05-23替代MLP的KAN,被开源项目扩展到卷积了本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参...
-
05-23受生成式AI推动,2025年全球公有云支出将增长到6754亿美元根据Gartner日前预测,受到生产式人工智能(GenAI)和应用现代化的推动,全球用户今年在公有云服务上的支出将增长67.54亿美元。这一数字与去年的56.1...

