新闻中心
-
07-15豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-12北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-12这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试四大VLM,竟都在盲人摸象?让现在最火的SOTA模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,他们...
-
07-10单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE释放进一步扩展Transformer的潜力,同时还可以保持计算效率。标准Transformer架构中的前馈(FFW)层会随着隐藏层宽度的增加而导致计算成本和激活...
-
07-10鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆2.4B的Memory3比更大的LLM和RAG模型获得了更好的性能。近年来,大型语言模型(LLM)因其非凡的性能而获得了前所未有的关注。然而,LLM的训练和推理...
-
07-09开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布作者|上海交通大学、上海人工智能实验室编辑|ScienceAI近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(SegmentAn...

