新闻中心
-
08-22支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结...
-
08-16以「垂直模型」引领AIGC商业化落地,FancyTech的技术路径是什么?我们正在见证又一轮技术革新,这一次是AIGC为个体提供表达自我的工具,让创作变得更加容易和普及,但背后的推动力却并不是「大」模型。两年以来,AIGC技术的发展速...
-
07-291890美元,就能从头训练一个还不错的12亿参数扩散模型只用1890美元、3700万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比...
-
07-15端侧设备AI代理优化框架问世,领域内准确率可达97%AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-09单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速微软的这项研究让开发者可以在单卡机器上以10倍的速度处理超过1M的输入文本。大型语言模型(LLM)已进入长上下文处理时代,其支持的上下文窗口从先前的128K猛增...
-
06-28史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍DiT都能用,生成视频无质量损失,也不需要训练。实时AI视频生成来了!本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于DiT的视频生成方法。该...

