新闻中心
-
04-29Concept Lancet— 宾夕法尼亚大学推出的图像编辑框架ConceptLancet(CoLan)是由宾夕法尼亚大学研究团队开发的一种零样本、即插即用的图像编辑框架。它通过在潜在空间中对图像进行稀疏分解,将图像表示为视...
-
02-27MME-CoT— 港中文等机构推出评估视觉推理能力的基准框架MME-CoT:大型多模态模型链式思维推理能力评估基准MME-CoT是由香港中文大学(深圳)、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大...
-
07-11SIGGRAPH2025|上科大、影眸联合提出DressCode:从文本生成3D服装板片AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-22无论真实还是AI视频,「摩斯卡」都能重建恢复4D动态可渲染场景AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
05-05瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好:各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能hold住:甚至是研究人员踢了一脚瑜伽球,机器狗...
-
03-132025苹果学者名单公布,华人占一半!宾大博士生曾和Jim Fan搞出英伟达最火机器人一年一度的「苹果学者」最新名单公布了!苹果机器学习研究中心(AppleMachineLearningResearch)刚刚宣布了2024年获得博士生奖学金的「苹...

