新闻中心
-
07-01等不来OpenAI的Q*,华为诺亚探索LLM推理的秘密武器MindStar先来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-26OpenAI停服,国产大模型免费用!开发者Token自由实现了今天凌晨,OpenAI突然宣布终止对中国提供API服务,进一步收紧国内开发者访问GPT等高水平大模型。国内开发者真是太难了。好在,随着开源大模型水平越来越高,开...
-
06-07阿里Qwen2正式开源,性能全方位包围Llama-3Qwen系列会是众多大学实验室新的默认基础模型吗?斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成...
-
06-06LLM | Yuan 2.0-M32:带注意力路由的专家混合模型图片一、结论写在前面Yuan+2.0-M32是一种基础架构,与Yuan-2.0+2B相似,采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
-
06-05单个4090可推理,2000亿稀疏大模型「天工MoE」开源在大模型浪潮中,训练和部署最先进的密集集LLM在计算需求和相关成本上带来了巨大挑战,尤其是在数百亿或数千亿参数的规模上。为了应对这些挑战,稀疏模型,如专家混合模...
-
06-04套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型斯坦福团队抄袭清华系大模型事件后续来了——Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文,由SiddharthSha...

