新闻中心
-
03-08「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题遮挡是计算机视觉很基础但依旧未解决的问题之一,因为遮挡意味着视觉信息的缺失,而机器视觉系统却依靠着视觉信息进行感知和理解,并且在现实世界中,物体之间的相互遮挡无...
-
03-07全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA半年多来,Meta开源的LLaMA架构在LLM中经受了考验并大获成功(训练稳定、容易做scaling)。沿袭ViT的研究思路,我们能否借助创新性的LLaMA架构...
-
03-05DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力,闭源模型就是比开源安全谷歌在2月之后突然切换到了996模式,不到一个月的时间抛出了5个模型。而DeepMindCEOHassabis本人也是四处为自家的产品站台,曝出了很多幕后的开发...
-
03-05复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持最近,OpenAI的视频生成模型Sora爆火,生成式AI模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包...
-
03-047B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力图神经网络(GNNs)善于利用图的结构信息进行推断,但通常需要进行特定领域的调优,以实现最佳性能,这使得它们在不同任务之间的泛化能力受到限制。大型语言模型(LL...
-
03-04只需少量计算和内存资源即可运行的小型 Llama 大模型背景介绍在当前信息量爆炸的时代,语言模型的训练日益变得复杂和困难。为了培训一个高效的语言模型,我们需要大量的计算资源和时间,这对很多人来说是不切实际的。同时,我...

