令牌_第13页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

03-07

ICLR 2025 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型...
02-26

选择最适合数据的嵌入模型：OpenAI 和开源多语言嵌入的对比测试

OpenAI最近宣布推出他们的最新一代嵌入模型embeddingv3，他们声称这是性能最出色的嵌入模型，具备更高的多语言性能。这一批模型被划分为两种类型：规模较...
02-19

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

在大模型内卷的同时，Transformer的地位也接连受到挑战。近日，RWKV发布了Eagle7B模型，基于最新的RWKV-v5架构。Eagle7B在多语言基准...
02-01

基于Rust的Zed编辑器已开源，内置对OpenAI和GitHub Copilot的支持

作者丨TimAnderson编译丨诺亚出品|51CTO技术栈（微信号：blog51cto）Zed编辑器项目目前仍处于预发布阶段，已在AGPL、GPL和Apach...
01-05

全力迈向闭环！DriveMLM：将LLM与自动驾驶行为规划完美结合！

写在前面&笔者的个人理解大型语言模型为智能驾驶开辟了新的格局，赋予了他们类似人类的思维和认知能力。本文深入研究了大型语言模型（LLM）在自动驾驶（AD）...
11-30

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长，推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。...

: 电话

: 客服

: 地图

: 搜索