新闻中心
-
07-18能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高复杂环境下透明物体的感知和抓取是机器人领域和计算机视觉领域公认的难题。近日,来自清华大学深圳国际研究生院的团队与合作者提出了一种视-触融合的透明物体抓取框架,该...
-
07-17字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA当前大语言模型(LargeLanguageModels,LLMs)如GPT4在遵循给定图像的开放式指令方面表现出了出色的多模态能力。然而,这些模型的性能严重依赖...
-
07-17GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群自GPT-4问世以来,人们一直惊艳于它强大的涌现能力,包括出色的语言理解能力、生成能力、逻辑推理能力等等。这些能力让GPT-4成为机器学习领域最前沿的模型之一。...
-
07-14大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务当前,大型语言模型(LLM)已经掀起自然语言处理(NLP)领域的变革浪潮。我们看到LLM具备强大的涌现能力,在复杂的语言理解任务、生成任务乃至推理任务上都表现优...
-
07-13BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」多模态大语言模型(MultimodalLargeLanguageModel,MLLM)依赖于LLM丰富的知识储备以及强大的推理和泛化能力来解决多模态问题,目前已...
-
07-06你大脑中的画面,现在可以高清还原了近几年,图像生成领域取得了巨大的进步,尤其是文本到图像生成方面取得了重大突破:只要我们用文本描述自己的想法,AI就能生成新奇又逼真的图像。但其实我们可以更进一步...

