多模_第196页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

12-14

你必须了解的关于谷歌最新AI模型Gemini的全部信息

什么是GoogleGemini?Gemini是谷歌推出的一种最新的、功能强大的AI模型，它不仅可以理解文本，还可以理解图像、视频和音频。作为一种多模式模型，Ge...
12-05

AI应用下一个热门应用已经出现：阿里巴巴和字节跳动悄悄上线了一款类似神器，可以让梅西跳舞轻而易举

AI视频生成神器再次登场。最近，阿里巴巴和字节跳动秘密上线了各自的工具阿里推出了AnimateAnyone，该项目由阿里巴巴智能计算研究院开发，你只需提供一个静...
12-04

魅族 MYVU 智能指环开售：支持 AR 眼镜多模交互，售价 399 元

魅族的智能指环MYVURing已经在2023年秋季无界生态发布会上亮相，并且已经开始销售，售价为399元MYVURing是为MYVU旗下两款智能眼镜打造的智能指...
12-04

突破分辨率极限：字节联合中科大揭示多模态文档大模型

现在甚至有了大型的多模态高分辨率文档！这项技术不仅能够准确识别图像中的信息，还能够根据用户需求调用自身的知识库来回答问题比如，看到图中马里奥的界面，直接就回答出...
12-04

横扫13个视觉语言任务！哈工深发布多模态大模型「九天」，性能直升5%

为了应对多模态大语言模型中视觉信息提取不充分的问题，哈尔滨工业大学（深圳）的研究人员提出了双层知识增强的多模态大语言模型-九天（JiuTian-LION）。需要...
12-04

任意文本、视觉、音频混合生成，多模态有了强大的基础引擎CoDi-2

研究者指出，CoDi-2标志着在开发全面的多模态基础模型领域取得了重大突破今年5月，北卡罗来纳大学教堂山分校、微软提出一种可组合扩散（ComposableDif...

: 电话

: 客服

: 地图

: 搜索