新闻中心
-
10-07长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构OryxAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-22支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结...
-
07-26英伟达对话模型ChatQA进化到2.0版本,上下文长度提到128K开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340...
-
07-157B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-07阿里Qwen2正式开源,性能全方位包围Llama-3Qwen系列会是众多大学实验室新的默认基础模型吗?斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成...
-
06-03英伟达新研究:上下文长度虚标严重,32K性能合格的都不多无情戳穿“长上下文”大模型的虚标现象——英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。但一番考验下来,在新指标“...

