新闻中心
-
02-07历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月开源AI世界的里程碑事件!我们正在见证历史:DeepSeek项目在全球最大代码托管平台GitHub上的Star量超过了OpenAI。截至本周五下午两点,Deep...
-
02-07DeepSeek用的GRPO占用大量内存?有人给出了些破解方法RTX3080移动版训练大型语言模型的实用指南本文旨在指导GPU资源受限的开发者如何利用GRPO(GroupRelativePolicyOptimization...
-
02-04致敬DeepSeek:以国产GPU为基,燎原中国AI生态之火DeepSeek开源模型(V3、R1系列等)在多语言理解和复杂推理任务中表现出色,极大促进了AI技术发展,为开发者提供了重要资源。DeepSeek不仅技术领先,...
-
01-30ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B基于探索驱动的大模型对齐方法COPO:赋予LLM探索能力,突破性能边界AIxiv专栏持续报道全球顶尖AI研究成果。如果您有优秀的研究成果,欢迎投稿至liyazh...
-
01-29原来,这些顶级大模型都是蒸馏的中国科学院深圳先进技术研究院、北京大学和零一万物等机构的研究人员在一篇新论文中指出,除了Claude、豆包和Gemini外,许多知名的闭源和开源大型语言模型(L...
-
01-27DARWIN 1.5 来啦!材料设计通用大语言模型,刷新多项实验性质预测记录DARWIN1.5:一款基于语言接口的材料发现与设计AI模型材料科学的核心挑战在于高效地寻找理想的材料成分和结构。传统的计算方法,例如高通量筛选和机器学习,通常...

