新闻中心
-
09-02Claude也变懒了!网友:学会给自己放假了开学将至,该收心的不止有即将开启新学期的同学,可能还有AI大模型。前段时间,Reddit上挤满了吐槽Claude越来越懒的网友。「它的水平下降了很多,经常停顿,...
-
04-15ReFT(表征微调):比PeFT效果更好的新的大语言模型微调技术ReFT(RepresentationFinetuning)是一种突破性的方法,有望重新定义我们对大型语言模型进行微调的方式。斯坦福大学的研究人员最近(4月)在...
-
03-30Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩一张照片+一段视频,就能让照片活起来!近日,由阿里、复旦大学、南京大学联合发布的可控人体视觉生成工作Champ火爆全网。该模型仅开源5天GitHub即收获1k星...
-
03-21DualBEV:大幅超越BEVFormer、BEVDet4D,开卷!这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉...
-
01-22解码策略在大型语言模型中的应用大型语言模型是自然语言处理领域的关键技术,在各种任务中表现出强大性能。解码策略是模型生成文本的重要环节之一。本文将详细介绍大型语言模型中的解码策略,并讨论其优缺...
-
01-22SqueezeNet简介及其特点SqueezeNet是一种小巧而精确的算法,它在高精度和低复杂度之间达到了很好的平衡,因此非常适合资源有限的移动和嵌入式系统。2016年,DeepScale、加...

