新闻中心
-
02-07DeepSeek用的GRPO占用大量内存?有人给出了些破解方法RTX3080移动版训练大型语言模型的实用指南本文旨在指导GPU资源受限的开发者如何利用GRPO(GroupRelativePolicyOptimization...
-
01-08更快、更强!地平线ViG,基于视觉Mamba的通用视觉主干网络ViG:高效且可扩展的视觉骨干网络论文链接:https://arxiv.org/abs/2405.18425成果:本工作已被AAAI2025收录。VisionM...
-
01-05低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling lawsAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
12-31把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍利用CPU和GPU协同计算,显著提升大语言模型推理效率!来自CMU、华盛顿大学和MetaAI的研究人员提出了一种名为MagicPIG的新方法,它巧妙地利用CPU...
-
12-13最好用的浏览器电脑版最佳电脑浏览器取决于个人偏好和需求:速度和插件:Google Chrome隐私和可定制性:Mozilla Firefox轻量化和 Windows 集成:Micr...
-
12-04夸克更新了有什么变化吗夸克浏览器更新变化:界面优化:更简洁直观沉浸式阅读模式:去除广告,提供舒适阅读体验功能拓展:多端同步、悬浮翻译、识图搜索性能提升:快速加载、减少内存占用隐私保护...

