新闻中心
-
05-27YOLOv10来啦!真正实时端到端目标检测过去几年里,YOLOs因在计算成本和检测性能之间实现有效平衡而成为实时目标检测领域的主流范式。研究人员针对YOLOs的结构设计、优化目标、数据增强策略等进行了深...
-
05-24谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍今年2月,谷歌上线了多模态大模型Gemini1.5,通过工程和基础设施优化、MoE架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理...
-
05-113倍生成速度还降内存成本,超越Medusa2的高效解码框架终于来了高效解码n-token序列,CLLMs+Jacobi解码框架。传统上,大型语言模型(LLMs)被认为是顺序解码器,逐个解码每个token。来自上海交通大学、加利...
-
05-09LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)写在前面&笔者的个人理解这篇论文致力于解决当前多模态大语言模型(MLLMs)在自动驾驶应用中存在的关键挑战,即将MLLMs从2D理解扩展到3D空间的问题...
-
04-29小红书从记忆机制解读信息检索,提出新范式获得 EACL Oral近日,来自小红书搜索算法团队的论文《GenerativeDenseRetrieval:MemoryCanBeaBurden》被自然语言处理领域国际会议EACL2...
-
04-29Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)多传感器与3DGS的结合“基于3D空间中的采样进行计算密集型SLAM任务所需的实时能力”的隐式表达法需要基于NeRF-based+SLAM方法。3DGS以其快速...

