新闻中心

清华系初创公司发布全球首个4D骨骼动画框架,实现一键将实景转化为动画,并且能够生成个性化角色

2024-01-19
浏览次数:
返回列表

苹果最近宣布将于2月2日推出首款虚拟头显设备vision pro,预计这款xr设备将引领下一代终端的快速发展。随着虚拟显示设备的普及,数字交互将从平面走向立体,立体模型和立体动画将成为未来的主流内容形式。多维沉浸式交互在虚实融合的趋势下也将成为潮流。

但从数据规模看,现阶段内容产业的数据积累仍以 2D 图像、平面视频为主,3D 模型、4D 动画等数据基础较为薄弱。其中,4D 动画是在传统 3D 模型的基础上引入时间序列,即随时间变化的 3D 模型,可以呈现出动态立体效果,在游戏动画、电影特效、虚拟现实等领域具有广泛的应用,但也是目前内容生态开发中最困难的环节。

因此,面向即将到来的多维沉浸式体验,构建立体化的数字内容将成为重要的基础性工作。

面向该前沿领域,清华系创业团队生数科技开展了系列研究和产品研发,于近期联合清华大学、同济大学等高校推出全球首个基于「骨骼动画」的 4D 动画生成框架「AnimatableDreamer」,能够直接将 2D 视频素材一键转成动态立体模型(即 4D 动画),支持自动提取骨骼动作、一键转换动画效果并可通过文字输入进行个性化角色生成。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

  • 论文地址:https://arxiv.org/pdf/2312.03795.pdf

  • 项目地址:https://animatabledreamer.github.io/

  • 论文标题:AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation

大家可以看以下Demo视频。一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

全新内容生产方式

颠覆立体动画开发流程

过往业界制作立体动画,需要经过 3D 建模、贴图渲染、骨骼绑定、动画制作等复杂流程,需要建模师、动画师等专业人员参与才能完成,效率低、成本高。据统计,单一个静态 3D 模型建模的生产周期就在数小时到几天时间,成本可高达上千美元,再进行动态化处理成本投入将更高。

从官方发布的 demo 视频可以看到,上传一段松鼠的 2D 实景视频,通过输入「A squirrel with red sweater」(穿红色毛衣的松鼠)的文本描述,原本实景的松鼠一键转成动画风格,而且完美保留了动作姿势,同步还可生成 360 度视角下的立体动态模型,通过切换文字描述,可以自定义角色,将松鼠任意切换为狐狸、杰尼龟等不同的卡通形象。

「AnimatableDreamer」可自动提取视频中目标对象(人物、动物等)的骨骼动作,再通过文本描述将该对象转换为任意的带骨骼动画模型。整个过程不受模版限制,支持任意视频长度和任意类型动作,具备高度的时间一致性和多视角一致性,并且导出的动态立体模型,能够在任意 3D 环境中进行渲染。

面向*动漫等领域的后期制作,通常需要针对动画做更多编辑,「AnimatableDreamer」也支持针对已经完成骨骼绑定的模型进行更换或编辑动画文件,实现更高的自由度。未来相关技术逐渐落地后,游戏开发、*动画等场景的 3D 建模、动画制作流程,有望变得更加高效。

面向未来

有望形*新的内容生态

刺鸟创客 刺鸟创客

一款专业高效稳定的AI内容创作平台

刺鸟创客 110 查看详情 刺鸟创客

在实现原理上,研究团队创新性地提出了规范得分蒸馏策略(Canonical Score Distillation,简称 CSD),在随时间变化的相机空间中对不同帧及不同视角的 3D 模型进行渲染及降噪,并统一将梯度回传至不同相机空间共享的规范空间中进行蒸馏,将 4D 生成降维至 3D,即将 4D 生成问题简化为 3D 空间上的生成。

「AnimatableDreamer」能直接从视频中提取关节动作,通过解耦物体的模型与运动,生成的模型具备高度的时间一致性和几何合理性,不受视频长度限制,而且能有效地消除如形状断裂、闪烁和多视角不一致等问题。一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

在有限视角和大幅度运动的场景中,由于引入了 Diffusion 模型的先验知识,即便输入的视频未覆盖完整物体,「AnimatableDreamer」也能自动补全画面信息,实现较好的生成质量。

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

可以说,「AnimatableDreamer」的提出直接打通文本到 4D 骨骼动画的生成,建模、贴图、骨骼绑定、动作驱动一气呵成!输入自然语言描述,自动输出立体动画视频,无需专业知识,普通人也能直接上手,轻松定制动画内容。

以「AnimatableDreamer」为基础的工作将大大降低 3D、4D 数字内容的生产难度,将交互体验丰富化,让每个人都能进行创意内容的生成和编辑,将催生出 3D 时代下全新的内容娱乐与内容消费模式。

畅想一下,在未来的虚拟世界中,用户可以快速搭建自定义的数字空间,打造个性化的交互体验。例如:

  • 数字空间下的每个人物形象可以任意个性化的生成,比如给小朋友穿上超人的衣服、万圣节随意切换节日主题服装等;

  • 养宠物的用户可以将自家宠物卡通化,例如将其生成虚拟的米老鼠形象。宠物日常就如卡通片一样,主人跟宠物的日常互动将变得趣味横生;

  • 人与人的互动方式也变得更丰富,随时随地可以来上一场主题派对,实时生成想要的派对环境、人物装扮等等。

作为一家成立不到一年的初创公司,生数科技团队长期致力于图像、3D、视频等多模态大模型领域,在 9 月份发布了 3D 资产创建工具 VoxCraft,在 Discord 正式上线,支持文图引导、分钟级创建 3D 模型、3D 贴图自定义更换等功能,赋能游戏开发、*动画等场景的 3D 建模流程。此次推出的 4D 骨骼动画生成是生数科技的又一项全新探索工作,未来将在 VoxCraft 的产品中进行集成。

VoxCraft 工具地址:https://voxcraft.ai/

苹果 Vision Pro 的来临不仅仅是硬件设备层面的重要革新,同时也将开启一场内容和体验革命的序幕。4D 动画生成等生成式 AI 的创新能力,除了带来更好的视觉呈现,还将以全新方式打开多维数字体验,为下一代人机交互带来更多可能。

以上就是清华系初创公司发布全球首个4D骨骼动画框架,实现一键将实景转化为动画,并且能够生成个性化角色的详细内容,更多请关注其它相关文章!


# follow  # 公司微信营销推广效果  # 大公司推广营销文案怎么写  # 安宁网站优化建设  # 河北seo优化正规公司  # 丹阳营销型网站推广价格  # 西藏seo快排方案  # 绑定  # 未来  # 首个  # 华纳  # 自定义  # 都能  # 还能  # 多维  # 清华  # 一键  # 产业  # 网站怎么优化搜索功能  # 黄梅seo推广多少钱  # 河北seo推广的好方法  # 杭州营销推广是什么 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 春运抢票用不用取票码  如何安装固态硬盘win10  如何打开命令提示符  华为5g手机怎么用4g网络  春运抢票如何快速抢到票  power在录音笔上是什么意思  选哪个折叠屏手机好用  pp是什么意思  制冰机power1灯亮是什么意思  eraser是什么意思  typescript需要学多久  征信信用不好如何恢复 征信信用不好如何恢复指南  春运高速高铁抢票攻略  主板如何禁用固态硬盘  税负是什么意思  万能表上的power是什么意思  苹果16哪些型号好用  typescript的文件如何执行  固态硬盘如何安装win10系统安装  1s等于多少ms  所有删除的聊天记录都可以恢复吗?  vi命令如何退出  linux下如何重定位命令  固态硬盘如何下载网页  如何使用net命令  unix时间戳转换公式  春运抢票极速版怎么抢票  typescript是什么软件  固态硬盘如何外接  360手机壁纸怎么改  春运预约抢票能抢到吗  如何利用运行命令查看声音启动  怎么看手机是不是双模5g手机  怎么在爱奇艺中投屏到电视最新方法  电动车eco和power是什么意思  夸克网盘是什么都有吗  什么软件能下载夸克视频  春运抢票准备什么东西  animal是什么意思  手机如何更改固态硬盘  哪个品牌有折叠屏手机卖  vue项目如何用typescript  夸克转存中是什么意思  a股等权市盈率中位数是什么意思  typescript解决了什么  gs是什么意思  typescript为什么能运行  固态硬盘4k如何看  power在坐标轴中是什么意思  进口超级维特拉三门版power是什么意思 

搜索