新闻中心
-
12-14扩散一切?3DifFusionDet:扩散模型杀进LV融合3D目标检测!笔者的个人理解近年来,扩散模型在生成任务上非常成功,自然而然被扩展到目标检测任务上,它将目标检测建模为从噪声框(noisyboxes)到目标框(objectbo...
-
12-04能耗比达到GPT-4 10倍!黄学东亲自解密Zoom AI的成功之道,AI伴侣直接替你开会近日,AI大佬,现任ZoomCTO的黄学东,在自家的官网上发表了一篇博客。其中隆重介绍了自己加入Zoom六个月之后创新的成果——ZoomAICompanion,...
-
11-13连葫芦娃都数不明白,解说英雄联盟的GPT-4V面临幻觉挑战让大模型同时理解图像和文字可能比想象中要难。在被称为「AI春晚」的OpenAI首届开发者大会拉开帷幕后,很多人的朋友圈都被这家公司发布的新产品刷了屏,比如不需要...
-
11-03微软AR/VR专利分享解决摄像头不同视角产生的遮挡或视差问题(映维网Nweon2023年11月03日)由于位置无法对应眼睛,对于基于摄像头透视的头显,用户可能很难正确地感知环境中对象相对于定义空间的空间关系。另外,同一定...
-
10-23首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和*新思路笔者的一些个人思考在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质...
-
10-17MiniGPT-4升级到MiniGPT-v2了,不用GPT-4照样完成多模态任务几个月前,来自KAUST(沙特阿卜杜拉国王科技大学)的几位研究者提出了一个名为MiniGPT-4的项目,它能提供类似GPT-4的图像理解与对话能力。例如Mini...

