新闻中心
-
12-14你必须了解的关于谷歌最新AI模型Gemini的全部信息什么是GoogleGemini?Gemini是谷歌推出的一种最新的、功能强大的AI模型,它不仅可以理解文本,还可以理解图像、视频和音频。作为一种多模式模型,Ge...
-
12-05AI应用下一个热门应用已经出现:阿里巴巴和字节跳动悄悄上线了一款类似神器,可以让梅西跳舞轻而易举AI视频生成神器再次登场。最近,阿里巴巴和字节跳动秘密上线了各自的工具阿里推出了AnimateAnyone,该项目由阿里巴巴智能计算研究院开发,你只需提供一个静...
-
12-04魅族 MYVU 智能指环开售:支持 AR 眼镜多模交互,售价 399 元魅族的智能指环MYVURing已经在2023年秋季无界生态发布会上亮相,并且已经开始销售,售价为399元MYVURing是为MYVU旗下两款智能眼镜打造的智能指...
-
12-04突破分辨率极限:字节联合中科大揭示多模态文档大模型现在甚至有了大型的多模态高分辨率文档!这项技术不仅能够准确识别图像中的信息,还能够根据用户需求调用自身的知识库来回答问题比如,看到图中马里奥的界面,直接就回答出...
-
12-04横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%为了应对多模态大语言模型中视觉信息提取不充分的问题,哈尔滨工业大学(深圳)的研究人员提出了双层知识增强的多模态大语言模型-九天(JiuTian-LION)。需要...
-
12-04任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2研究者指出,CoDi-2标志着在开发全面的多模态基础模型领域取得了重大突破今年5月,北卡罗来纳大学教堂山分校、微软提出一种可组合扩散(ComposableDif...

