新闻中心
-
07-17大模型训练成本降低近一半!新加坡国立大学最新优化器已投入使用优化器在大语言模型的训练中占据了大量内存资源。现在有一种新的优化方式,在性能保持不变的情况下将内存消耗降低了一半。该成果由新加坡国立大学打造,在ACL会议上获得...
-
07-17字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA当前大语言模型(LargeLanguageModels,LLMs)如GPT4在遵循给定图像的开放式指令方面表现出了出色的多模态能力。然而,这些模型的性能严重依赖...
-
07-17人工智能领域,突破难题:国产大模型“无源之水”问题得到解决。人工智能领域,突破难题:国产大模型“无源之水”问题得到解决。在2023年世界人工智能大会的“大模型时代的通用人工智能产业发展机遇以及风险”论坛上,多位通用人工智...
-
07-17清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时真·“未雨绸缪”,清华大学「鬼天气」预报大模型来了!是能破解世界未解难题的那种——公里尺度下0~3小时极端降水都能预报。包括短时强降水、暴风雨、暴雪、冰雹等在内...
-
07-16卫星通信牵引物联网竞争升维,模组厂商如何决胜百亿市场?早在20世纪80年代,通过卫星转播电视信号和转发通信报文就已经成为了主流趋势。彼时,摩托罗拉公司提出了一个伟大的构想——通过66颗卫星组成的近地星群,建设一个覆...
-
07-03清华朱军团队新作:使用4位整数训练Transformer,比FP16快2.2倍,提速35.1%,加速AGI到来!将激活、权重和梯度量化为4位,有望加速神经网络训练。然而,现有的4位训练方法需要自定义数字格式,而现代硬件不支持这种格式。最近,清华朱军团队提出了一种使用INT...

