新闻中心
-
05-2370B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队70B模型,秒出1000token,换算成字符接近4000!研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍!不仅是快,...
-
05-23我们一起聊聊AI模型组合指南实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自AGuidetoModelComposition,作者SherlockXu。考虑一款旨在识别和分类野...
-
05-23简单通用:视觉基础网络3倍无损训练加速,清华EfficientTrain++入选TPAMI 2025本讨论文作者王语霖是清华大学自动化系2019级直博生,师从吴澄院士和黄高副教授,主要研究方向为高效深度学习、计算机视觉等。他曾以第一作者在TPAMI、NeurI...
-
05-23众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸大模型排行榜哪家强?还看LLM竞技场~截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。图片然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同...
-
05-23时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。就在5月14日,阿布扎比先进技术研究委员会(...
-
05-23克雷研究所100万美元奖金要归AI了数学界规则大改,未来数学家如何应对「海量猜想」在数学的世界里,想要对“一个未经证实的猜想”进行完整的证明,往往需要天赋、直觉和经验的结合,即使是数学家也很难解释自己的发现过程。然而,随着近几年大模型的崛起,...

