新闻中心
-
10-24MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-24清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混...
-
10-22还是原装Transformer好!北大清华团队同时揭示Mamba等推理短板AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-21又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-20中国科大在钙钛矿软X射线探测器件领域取得重要进展重写后的文字:中国科学技术大学微电子学院胡芹特任研究员团队在钙钛矿软X射线探测器研究中取得新进展。基于钙钛矿半导体的缺陷调控和PIN垂直器件结构,团队实现了钙钛...
-
10-18《2025全球碳中和年度进展报告》发布重写文本:10月17日,《2024全球碳中和年度进展报告》(以下简称“报告”)在北京发布。清华大学环境学院党委书记、清华大学碳中和研究院减污降碳协同增效研究中心...

