新闻中心
-
01-11阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTAOpenAIGPT-4V和GoogleGemini都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM成为了现在业界最热的研究方向。...
-
01-11GPT-5前瞻!艾伦人工智能研究所发布最强多模态模型,预测GPT-5新能力GPT-5何时到来,会有什么能力?来自艾伦人工智能研究所(AllenInstituteforAI)的新模型告诉你答案。艾伦人工智能研究所推出的Unified-I...
-
01-10超越SOTA的MapEX:令人惊叹的性能提升和无图感知技术写在前面&笔者的个人理解看完这篇文章,会有一种无图感知到头了的错觉???刚刚出炉的MapEX,迫不及待的吸取了一波文章精华,顺便分享给大家。MapEX的...
-
01-09清华大学新方法成功定位精确视频片段!SOTA被超越且已开源只需一句话描述,就能在一大段视频中定位到对应片段!比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳:就连“大...
-
01-08新技术Repaint123:高效地生成优质的单视图3D,仅需2分钟!将一幅图像转换为3D的方法通常采用ScoreDistillationSampling(SDS)的方法,尽管结果令人印象深刻,但仍然存在多个不足之处,包括多视角不...
-
01-08美团、浙大等合作,打造全流程移动端多模态大模型MobileVLM,能够实时运行,并且采用骁龙888处理器大模型涌向移动端的浪潮愈演愈烈,终于有人把多模态大模型也搬到了移动端上。近日,美团、浙大等推出了能够在移动端部署的多模态大模型,包含了LLM基座训练、SFT、V...

