新闻中心
-
03-19学好线性代数,玩转推荐系统作者|汪昊审校|重楼说到21世纪互联网的技术,除了Python/Rust/Go等一系列新型编程语言的诞生,信息检索技术的蓬勃发展也是一大亮点。互联网上第一个纯技...
-
03-18总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述大语言模型(LargeLanguageModels,LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如GPT-4、Gemini、Claude等,但...
-
02-26高性能 LLM 推理框架的设计与实现一、大语言模型推理概要介绍与传统的CNN模型推理不同,大语言模型的推理通常会分成prefill和decoding两个阶段。每一个请求发起后产生的推理过程都会先经...
-
02-04研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱亚马逊云计算人工智能实验室的研究人员最近发现,网络上存在大量由机器翻译生成的内容,而这些翻译跨越多种语言的质量普遍较低。研究团队强调了在训练大型语言模型时,数据...
-
01-23谷歌发布能让 AI 自主判断输出准确性的模型训练框架 ASPIRE谷歌近日发布新闻稿,宣布推出ASPIRE训练框架,专为大语言模型设计。该框架旨在提升AI模型的选择性预测能力。谷歌提到,当下大语言模型在自然语言理解和生成内容方...
-
11-27生物医学NLP领域的特定预训练模型:PubMedBERT今年大语言模型的迅速发展导致像BERT这样的模型现在被称为“小”模型。在Kaggle的LLM科学考试比赛中,使用deberta的选手获得了第四名,这是一个非常出...

