新闻中心
-
11-02DeepMind:谁说卷积网络不如ViT?本文对按比例扩大的NFNets进行了评估,并挑战了ConvNets在大规模问题上表现不如ViTs的观点深度学习的早期成功可归功于卷积神经网络(ConvNets)...
-
10-30苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率习惯了StableDiffusion,如今终于又迎来一个俄罗斯套娃式(Matryoshka)Diffusion模型,还是苹果做的。在生成式AI时代,扩散模型已经...
-
10-26FMCW雷达位置识别如何优雅的实现(IROS2025)大家好,我叫袁健豪,很开心来自动驾驶之心平台分享我们在IROS2023上关于雷达位置识别的工作。由于其对挑战性环境的固有抗性,使用调频连续波(FMCW)雷达的定...
-
10-24RLHF模型普遍存在「阿谀奉承」,从Claude到GPT-4无一幸免不管你是身处AI圈还是其他领域,或多或少的都用过大语言模型(LLM),当大家都在赞叹LLM带来的各种变革时,大模型的一些短板逐渐暴露出来。例如,前段时间,Goo...
-
10-23深度学习科研,如何高效进行代码和实验管理?回答一作者:叶小飞链接:https://www.zhihu.com/question/269707221/answer/2281374258我之前在北美奔驰落地...
-
10-21参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布...

