新闻中心
-
03-07ICLR 2025 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型...
-
02-26选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试OpenAI最近宣布推出他们的最新一代嵌入模型embeddingv3,他们声称这是性能最出色的嵌入模型,具备更高的多语言性能。这一批模型被划分为两种类型:规模较...
-
02-19RNN模型挑战Transformer霸权!1%成本性能比肩Mistral-7B,支持100+种语言全球最多在大模型内卷的同时,Transformer的地位也接连受到挑战。近日,RWKV发布了Eagle7B模型,基于最新的RWKV-v5架构。Eagle7B在多语言基准...
-
02-01基于Rust的Zed编辑器已开源,内置对OpenAI和GitHub Copilot的支持作者丨TimAnderson编译丨诺亚出品|51CTO技术栈(微信号:blog51cto)Zed编辑器项目目前仍处于预发布阶段,已在AGPL、GPL和Apach...
-
01-05全力迈向闭环!DriveMLM:将LLM与自动驾驶行为规划完美结合!写在前面&笔者的个人理解大型语言模型为智能驾驶开辟了新的格局,赋予了他们类似人类的思维和认知能力。本文深入研究了大型语言模型(LLM)在自动驾驶(AD)...
-
11-30使用Accelerate库在多GPU上进行LLM推理大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。...

