新闻中心
-
11-24英伟达面临商业机密窃取指控!视频会议曝光证据,涉案员工已承认罪行英伟达只是举行了一个视频会议,结果却面临了起诉???是的,而且导火索还只是几张电脑截屏。最新消息,汽车零部件龙头老大法雷奥(Valeo)起诉英伟达,原因是窃取商...
-
11-23清华大学实验室研发的「计图」框架助力,胡事民院士加入AI领域的行列清华大学胡事民教授荣幸当选为中国科学院院士!2023年两院院士增选当选院士名单已经发布今年,中国科学院增选了59位院士,其中包括8位信息技术科学部院士,胡事民教...
-
11-18GPT、Llama等大模型存在「逆转诅咒」,这个bug该如何缓解?中国人民大学的研究人员发现,Llama等因果语言模型遇到的“逆转诅咒”可以归咎于next-tokenprediction+causallanguagemodel...
-
11-18普林斯顿开源34B数学模型:参数减半,性能媲美谷歌Minerva,使用550亿Token进行专业数据训练数学,作为科学的基石,一直以来都是研究和创新的关键领域。最近,普林斯顿大学等七家机构联合发布了一个专门用于数学的大语言模型LLEMMA,性能媲美谷歌Minerv...
-
11-17一招分辨刷榜作弊大模型,博士小哥开源AI数学“照妖镜”如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的?今年,有人在匈牙利全国数学期末考试刚刚公布的题目上进行了一次全面测试很多模型一下子就“现原...
-
11-15S-LoRA:一个GPU运行数千大模型成为可能一般情况下,大型语言模型的部署通常采用"预训练-微调"的方式。然而,当对多个任务(如个性化助手)进行基础模型的微调时,训练和服务的成本会变得...

