deepseek_第285页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

07-01

等不来OpenAI的Q*，华为诺亚探索LLM推理的秘密武器MindStar先来了

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
06-26

OpenAI停服，国产大模型免费用！开发者Token自由实现了

今天凌晨，OpenAI突然宣布终止对中国提供API服务，进一步收紧国内开发者访问GPT等高水平大模型。国内开发者真是太难了。好在，随着开源大模型水平越来越高，开...
06-07

阿里Qwen2正式开源，性能全方位包围Llama-3

Qwen系列会是众多大学实验室新的默认基础模型吗？斯坦福团队套壳清华大模型的事件不断发酵后，中国模型在世界上开始得到了更多关注。不少人发现，原来中国已经有不少成...
06-06

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面Yuan+2.0-M32是一种基础架构，与Yuan-2.0+2B相似，采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
06-05

单个4090可推理，2000亿稀疏大模型「天工MoE」开源

在大模型浪潮中，训练和部署最先进的密集集LLM在计算需求和相关成本上带来了巨大挑战，尤其是在数百亿或数千亿参数的规模上。为了应对这些挑战，稀疏模型，如专家混合模...
06-04

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福团队抄袭清华系大模型事件后续来了——Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文，由SiddharthSha...

: 电话

: 客服

: 地图

: 搜索