新闻中心
-
06-03LLM的「母语」是什么?大语言模型的「母语」是什么?我们的第一反应很可能是:英语。但事实果真如此吗?尤其是对于能够听说读写多种语言的LLM来说。对此,来自EPFL(洛桑联邦理工学院)的...
-
05-28用于精确目标检测的多网格冗余边界框标注一、前言目前领先的目标检测器是基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器,它接收输入图像并...
-
03-07ICLR 2025 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型...
-
03-06Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引...
-
02-04陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好Transformer的技能树是越来越厉害了。来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员,最近发表了一篇论文,他们通过使用大型语...
-
02-01准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源OpenAI的GPT-4V和谷歌的Gemini多模态大语言模型引起了业界和学界的广泛关注。这些模型在多个领域展示了对视频的深入理解能力,从不同角度呈现出了其潜力...

