新闻中心
-
04-26颜水成挂帅,昆仑万维2050全球研究院联合NUS、NTU发布Vitron,奠定通用视觉多模态大模型终极形态近日,由颜水成教授带队,昆仑万维2050全球研究院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。这是一款重...
-
04-25颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。项目主页&Demo:https://vitron-llm.github....
-
04-01上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。△棕色文本为区分两张图的关...
-
02-06三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法常用的优化语义分割模型的损失函数包括SoftJaccard损失、SoftDice损失和SoftTversky损失。然而,这些损失函数与软标签不兼容,因此无法支持...
-
01-22介绍一个细致的情感分析工具细粒度情感分析器是一种机器学习模型,用于识别文本中的情感细节。在自然语言处理中,情感分析是一项重要任务,它帮助我们理解文本中的情感,更好地了解人们的想法和感受。...
-
12-04横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%为了应对多模态大语言模型中视觉信息提取不充分的问题,哈尔滨工业大学(深圳)的研究人员提出了双层知识增强的多模态大语言模型-九天(JiuTian-LION)。需要...

