新闻中心
-
03-26腾讯机器人研究登顶刊!能帮程序员安显示器,像真人一样协同干活国产机器人新突破:两只各自独立的机械臂,已经可以丝滑地打配合了!不信你看这双手拧瓶盖:拧完再端起杯子倒水:活灵活现,如真人。呐,还能搭把手帮程序员安装好显示屏:...
-
03-253140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+P...
-
03-21DualBEV:大幅超越BEVFormer、BEVDet4D,开卷!这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉...
-
03-20谷歌发布“Vlogger”模型:单张图片生成10秒视频谷歌发布了一个新的视频框架:只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。视频时长可变,目前看到的示例最高为10s。可以看到,无论是口型...
-
03-19可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」在视觉生成领域迅速发展的进程中,扩散模型已经完全改变了这一领域的发展态势,其引入的文本引导生成功能标志着能力方面的深刻变革。然而,仅依赖文本来调节这些模型并不能...
-
03-18巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数传统的时空预测模型通常需要大量数据支持才能取得良好效果。然而,由于不同城市发展水平的差异和数据收集政策的不一致,许多地区的时空数据(例如交通和人群流动数据)受到...

