新闻中心
-
11-01强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法在奖励中减去平均奖励在当今的大模型时代,以RLHF为代表的强化学习方法具有无可替代的重要性,甚至成为了OpenAIο1等模型实现强大推理能力的关键。但这些强化学...
-
10-31显卡上面TYPE-C是什么接口显卡上的 TYPE-C 接口是一种新型接口,具有以下特点:小巧紧凑、双向传输、高带宽、供电和多功能性,可为显卡连接显示器和外设提供更小的尺寸、更高的带宽、更方便...
-
05-10LLM 评估新纪元:Arthur Bench 全方位解读一、传统文本评估面临的挑战近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一...
-
04-15ReFT(表征微调):比PeFT效果更好的新的大语言模型微调技术ReFT(RepresentationFinetuning)是一种突破性的方法,有望重新定义我们对大型语言模型进行微调的方式。斯坦福大学的研究人员最近(4月)在...
-
04-03LLM超长上下文查询-性能评估实战在大型语言模型(LLM)的应用中,有几个场景需要以结构化的方式呈现数据,其中信息提取和查询分析是两个典型的例子。我们最近通过更新的文档和一个专门的代码仓库强调了...
-
03-28和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异3月28日消息,根据LMSYSOrg公布的最新基准测试报告,Claude-3得分以微弱优势超越GPT-4,成为该平台“最佳”大语言模型。本网站首先介绍下LMSY...

