新闻中心
-
05-02搜狗CTO是谁?1. :AI听写服务开放策略的技术背景与业务价值 在自然语言处理领域,AI听写服务已成为提升用户体验的关键技术之一。搜狗作为国内领先的互联网产品公司,其CTO杨...
-
04-29DeepSeek - R1 671B版本硬件有什么要求?核心硬件配置要求包括:1. GPU需800GB-1.4TB显存,推荐8NVIDIA A100 80GB或H100 94GB,显存带宽4.8TB/s以上;量化版需...
-
04-15DeepSeek支持的GPU型号有哪些?DeepSeek 支持多种 GPU 型号和配置,包括 NVIDIA、AMD 和国产显卡。1. NVIDIA GPU:主流架构包括 Ampere(A100、A30...
-
03-05ByteQC:通往大规模实用化量子化学计算的曙光字节跳动研发并开源了基于GPU加速的大规模量子化学计算工具集ByteQC,显著提升了量子化学计算效率。该工具集针对真实化学体系中大量微观粒子的精确计算难题,利用...
-
03-05摩尔线程 Round Attention:以轮次块稀疏性开辟多轮对话优化新范式摩尔线程科研团队在arXiv上发表最新研究成果《RoundAttention:以轮次块稀疏性开辟多轮对话优化新范式》,该方法显著提升了大型语言模型(LLM)的多...
-
02-07DeepSeek用的GRPO占用大量内存?有人给出了些破解方法RTX3080移动版训练大型语言模型的实用指南本文旨在指导GPU资源受限的开发者如何利用GRPO(GroupRelativePolicyOptimization...

