新闻中心
-
01-16自动驾驶领域的端到端技术是否会替代Apollo、autoware等框架?RethinkingtheOpen-LoopEvaluationofEnd-to-EndAutonomousDrivinginnuScenes作者单位:百度作者...
-
01-14探析OCR识别的原理和应用场景Labs导读日常生活中,截图提取和拍照搜题都广泛应用了OCR(光学字符识别)技术,这是文字识别领域中非常重要的一项技术Part01、什么是OCROCR(光学字符...
-
01-12基于双任务的端到端无模板反应预测模型重新排版|X本文旨在介绍西南交通大学杨燕/江永全团队在《应用智能》杂志上发表的研究成果,其中的第一作者是胡昊哲,一位硕士生论文链接:https://doi.or...
-
01-05旷视开源多模态大模型,支持文档级OCR,覆盖中英文,是否标志着OCR的终结?想将一份文档图片转换成Markdown格式?以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤——这一次,只需一句话命令,多模态大模型V...
-
01-05MobileSAM:为移动设备提供高性能的轻量级图像分割模型一、引言随着移动设备的普及和计算能力的提升,图像分割技术成为了研究的热点。MobileSAM(MobileSegmentAnythingModel)是一种针对移...
-
12-04新标题:北京大学开创新纪元:类别级6D物体位姿估计新范式在NeurIPS 2025取得最新最佳结果北京大学的研究人员提出了一种新的类别级6D物体位姿估计方法,这是一个基础且重要的问题,广泛应用于机器人、虚拟现实和增强现实等领域。他们在这篇论文中取得了新的SO...

