新闻中心
-
09-07FineVision— Hugging Face开源的视觉语言数据集FineVision是什么FineVision是由HuggingFace推出的一个开源视觉语言数据集,旨在训练更先进的视觉语言模型。该数据集包含1730万张图像...
-
08-28全运会首批70万张门票明天开售11月9日,第十五届全运会将在广东广州正式开幕,届时,来自全国各地的运动健儿们将在粤港澳大湾区的赛场上一展风采。
-
08-01基于PaddleOCR2.4的轻量级文字识别技术创新大赛Baseline该内容介绍轻量级文本识别创新大赛,围绕轻量级文字识别技术,提供12万张真实图片数据集。还讲解了基于PaddleOCR的环境设置、数据准备、训练参数配置、模型训练...
-
07-29基于PaddleOCR2.4的天池街景字符编码识别Baseline该内容为天池街景字符编码识别比赛的实现过程。介绍了赛题数据来自SVHN数据集,含训练集3W张、验证集1W张等。使用PaddleOCR,经数据准备、参数配置,以C...
-
07-29飞桨常规赛:中文场景文字识别- 12月第8名方案该内容围绕中文场景文字识别常规赛展开,介绍了比赛任务是用飞桨框架预测图像文字行内容。涵盖数据集情况,利用PaddleOCR的配置、训练、评估、预测等流程,包括模...
-
05-29Jodi— 中国科学院推出的视觉理解与生成统一模型Jodi是由中国科学院计算技术研究所与中国科学院大学共同研发的一种扩散模型框架,其核心在于通过联合建模图像域与多个标签域,将视觉生成与理解功能整合在一起。该框架...

