新闻中心
-
06-07Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想大模型也可解释了?大模型都在想什么?OpenAI找到了一种办法,能给GPT-4做「扫描」,告诉你AI的思路,而且还把这种方法开源了。大语言模型(LLM)是当前A...
-
06-03不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小——必须在固定的计算预算下权衡这两项因...
-
05-24HuggingFace教你怎样做出SOTA视觉模型前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。在这篇Hugging...
-
04-17AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊作者|陈旭鹏编辑|ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术...
-
04-03大模型中常用的注意力机制GQA详解以及Pytorch代码实现组查询注意力(GroupedQueryAttention)是大型语言模型中的一种多查询注意力力方法,它的目标是在保持MQA速度的同时实现MHA的质量。Group...
-
04-03开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!0.这篇文章干了啥?提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务...

