新闻中心
-
06-26ICML 2025 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-07Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想大模型也可解释了?大模型都在想什么?OpenAI找到了一种办法,能给GPT-4做「扫描」,告诉你AI的思路,而且还把这种方法开源了。大语言模型(LLM)是当前A...
-
05-27DiffMap:首个利用LDM来增强高精地图构建的网络论文标题:DiffMap:EnhancingMapSegmentationwithMapPriorUsingDiffusionModel论文作者:PeijinJ...
-
05-23替代MLP的KAN,被开源项目扩展到卷积了本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参...
-
05-10原作者带队,LSTM真杀回来了!LSTM:这次重生,我要夺回Transformer拿走的一切。在20世纪90年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,...
-
05-0658行代码把Llama 3扩展到100万上下文,任何微调版都适用堂堂开源之王Llama3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间...

