新闻中心
-
11-01【进展】北理工在硅基石墨烯湿度传感器的研究中取得重要进展;1.北京大学集成电路学院与北方工业大学集成电路学院签署学科共建协议;2.北理工课题组在硅基石墨烯湿度传感器的研究中取得了重要进展;3.上海交大吴亚东副教授发表关...
-
11-01新视角设计下一代时序基础模型,Salesforce推出Moirai-MoEAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
10-14图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?自从Transformer模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战Transformer的地位,还致敬了经典论文的...
-
09-20CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」大模型新范式OpenAIo1一经发布,如何「复刻」出o1便成为了A...
-
08-07八问八答搞懂Transformer内部运作原理七年前,论文《Attentionisallyouneed》提出了transformer架构,颠覆了整个深度学习领域。如今,各家大模型都以transformer架...
-
06-11用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高用神经架构搜索给LLM瘦身,同等准确度可让LLaMA2-7B模型大小降2倍。LLM(大型语言模型)的一个主要特点是“大”,也因此其训练和部署成本相当高,如何在保...

