新闻中心
-
11-20「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR多模态对比表示(MCR)旨在将来自不同模态的输入编码到一个语义对齐的共享空间中随着视觉-语言领域中CLIP模型的巨大成功,越来越多的模态对比表征开始出现,并在许...
-
11-17谷歌推出Mirasol:30亿参数,将多模态理解扩展至长视频11月16日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型Mirasol,可以回答有关视频的问题并创造新的记录。AI模型目前很难处理不同的数据流,如果要让...
-
11-14关于网易云音乐冷启动技术的推荐系统一、问题背景:冷启动建模的必要性和重要性作为一个内容平台,云音乐每天都会有大量的新内容上线。虽然相较于短视频等其他平台,云音乐平台的新内容数量相对较少,但实际数...
-
11-10中电信人工智能总经理何忠江:2025年将发布超自然语音2.011月10日下午,中电信人工智能总经理何忠江在人工智能与数据产业发展合作论坛上,对通用大模型的产品和思路进行了解读何忠江首先分享了对通用人工智能的看法,他认为,...
-
11-10UniPAD:通用自动驾驶预训练模式!各类感知任务都可支持最近,新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是,语言视觉多模态大模型融合已经是业界共识了,UniPad这篇文章就比较有代表性,多模态的输入,...
-
11-08科大讯飞ICDAR 2025:图文识别再创辉煌,收获四项冠军ICDAR2023(国际文档分析与识别会议)作为文档图像分析识别领域最重要的国际会议之一,最近传来了令人振奋的消息:科大讯飞研究院与中科大语音及语言信息处理国家...

