新闻中心
-
01-10无需SA依赖,高效实现像素级推理的字节多模态大模型PixelLM多模态大模型爆发,准备好进入图像编辑、自动驾驶和机器人技术等细粒度任务中实际应用了吗?目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级...
-
01-10NeurIPS23|「读脑术」解码大脑活动重构视觉世界在这篇NeurIPS23论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视觉「读脑术」,能够从人类的大脑活动中以高分辨率解析出人眼观看到的...
-
01-10中国科学院团队创造了一种统一框架,用于提高酶动力学参数的预测准确性编辑|萝卜皮酶动力学参数的预测对于生物技术和工业应用中酶的设计和优化至关重要,然而目前的预测工具在各种任务上的有限性能限制了它们的实际应用。中国科学院的研究人员...
-
01-09清华大学新方法成功定位精确视频片段!SOTA被超越且已开源只需一句话描述,就能在一大段视频中定位到对应片段!比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳:就连“大...
-
01-08新技术Repaint123:高效地生成优质的单视图3D,仅需2分钟!将一幅图像转换为3D的方法通常采用ScoreDistillationSampling(SDS)的方法,尽管结果令人印象深刻,但仍然存在多个不足之处,包括多视角不...
-
01-08逼真实时渲染:基于Street Gaussians的动态城市场景建模实话实说,技术的更新速度确实非常快,这也导致了学术界中一些旧有的方法逐渐被新的方法所取代。最近,浙江大学的研究团队提出了一种名为Gaussians的新方法,引起...

