新闻中心
-
02-05罕见!苹果开源图片编辑神器MGIE,要上iPhone?拍张照片,输入文字指令,手机就开始自动修图?这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近,AI在图片编辑方面取...
-
02-04Agent像人一样分工协作,还能“群聊”交换信息智能体也要有“规范手册”!一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增...
-
02-04图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?你还...
-
02-02匿名论文提出奇招!增强大模型长文本能力居然还能这么做一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参...
-
02-01纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么?最近,麻省理工学院计算机科学与人工智能...
-
02-01赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了在去年4月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究者们联合发布了LLaVA(LargeLanguageandVisionAssistant)。尽...

