新闻中心
-
03-01几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling在标准的UNet结构中,longskipconnection上的scaling系数一般为1。然而,在一些著名的扩散模型工作中,比如Imagen,Score-ba...
-
02-27谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?要说最近最郁闷的公司,谷歌肯定算得上一个:自家的Gemini1.5刚刚发布,就被OpenAI的Sora抢尽了风头,堪称AI界的「汪峰」。具体来说,谷歌这次推出的...
-
02-26高性能 LLM 推理框架的设计与实现一、大语言模型推理概要介绍与传统的CNN模型推理不同,大语言模型的推理通常会分成prefill和decoding两个阶段。每一个请求发起后产生的推理过程都会先经...
-
02-02数据为王!如何通过数据一步步构建高效的自动驾驶算法?写在前面&笔者的个人理解下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈,学术...
-
01-29开源在线的年轻人首选多模态大模型:轻松运行1080Ti一款名为Vary-toy的“年轻人的第一个多模态大模型”来了!模型大小不到2B,消费级显卡可训练,GTX1080ti8G的老显卡轻松运行。想将一份文档图片转换成...
-
01-24使用TensorFlow来建立神经网络的方法TensorFlow是一种流行的机器学习框架,用于训练和部署各种神经网络。本文将讨论如何使用TensorFlow构建简单的神经网络,并提供示例代码助您入门。构建...

