新闻中心
-
08-05离开OpenAI待业的Karpathy做了个大模型新项目,Star量一日破千没工作也要「卷」。闲不下来的AndrejKarpathy又有了新项目!过去几天,OpenAI非常热闹,先有AI大牛AndrejKarpathy官宣离职,后有视频...
-
08-05OpenDevin出技术报告了,大模型Agent开发者必读热门通用大模型Agent平台。今年3月,「全球首位AI软件工程师」Devin引爆了AI圈。与此前AI编程助手不同的是,Devin并不只是辅助编程的角色,而是能够...
-
07-29陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」在奥数问题面前,AI的「智商」往往不太够用。不过,这已经是过去式了。谷歌DeepMind用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥...
-
07-28贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM用来运行Llama3405B优势明显。最近,Meta开源了最新的405B模型(Llama3.1405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多...
-
07-25精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405BAI竞赛正以前所未有的速度加速,继Meta昨天推出其新的开源Llama3.1模型之后,法国AI初创公司MistralAI也加入了竞争。刚刚,MistralAI宣...
-
07-24从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本我们知道LLM是在大规模计算机集群上使用海量数据训练得到的,本站曾介绍过不少用于辅助和改进LLM训练流程的方法和技术。而今天,我们要分享的是一篇深入技术底层的文...

