新闻中心
-
04-15谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2025近期,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM研究院等机构的研究人员探索了模型重编程(modelreprogramming)在大语言模型(LLMs)上应用,并提...
-
04-12一文搞懂Tokenization!语言模型是对文本进行推理的,文本通常是字符串形式,但模型的输入只能是数字,因此需要将文本转换成数字形式。Tokenization是自然语言处理的基本任务,根据特...
-
04-11大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA大语言模型潜力被激发——无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。蒙纳士大学、蚂蚁和IBM研究院联合开发了一种通用框架,成功推动了大语言模...
-
02-26干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。当时还有网友表示,这2小时课程的含金量,相当于大学4年。就在这几天,Karpat...
-
01-24大规模模型中embedding的实现技术嵌入(Embedding)在大型深度学习模型中是将高维度输入数据(如文本或图像)映射到低维度空间的向量表示。在自然语言处理(NLP)中,嵌入常用于将单词或短语映...
-
01-23常用参数类型和作用:大型语言模型的参数详解大型语言模型是指参数数量较多的自然语言处理模型,通常包含数十亿个参数。这些参数在决定模型性能方面扮演关键角色。下文将介绍主要参数及其作用。1.嵌入层参数嵌入层被...

