万张_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

09-07

FineVision— Hugging Face开源的视觉语言数据集

FineVision是什么FineVision是由HuggingFace推出的一个开源视觉语言数据集，旨在训练更先进的视觉语言模型。该数据集包含1730万张图像...
08-28

全运会首批70万张门票明天开售

11月9日，第十五届全运会将在广东广州正式开幕，届时，来自全国各地的运动健儿们将在粤港澳大湾区的赛场上一展风采。
08-01

基于PaddleOCR2.4的轻量级文字识别技术创新大赛Baseline

该内容介绍轻量级文本识别创新大赛，围绕轻量级文字识别技术，提供12万张真实图片数据集。还讲解了基于PaddleOCR的环境设置、数据准备、训练参数配置、模型训练...
07-29

基于PaddleOCR2.4的天池街景字符编码识别Baseline

该内容为天池街景字符编码识别比赛的实现过程。介绍了赛题数据来自SVHN数据集，含训练集3W张、验证集1W张等。使用PaddleOCR，经数据准备、参数配置，以C...
07-29

飞桨常规赛：中文场景文字识别- 12月第8名方案

该内容围绕中文场景文字识别常规赛展开，介绍了比赛任务是用飞桨框架预测图像文字行内容。涵盖数据集情况，利用PaddleOCR的配置、训练、评估、预测等流程，包括模...
05-29

Jodi— 中国科学院推出的视觉理解与生成统一模型

Jodi是由中国科学院计算技术研究所与中国科学院大学共同研发的一种扩散模型框架，其核心在于通过联合建模图像域与多个标签域，将视觉生成与理解功能整合在一起。该框架...

: 电话

: 客服

: 地图

: 搜索