新闻中心
-
09-10还在死磕AI咒语?北大-百川搞了个自动提示工程系统PASAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
09-08大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
09-07用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构硬件发展速度跟不上AI需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还要更快,如图1和2所示。可以看到,AI...
-
09-05第一个100%开源的MoE大模型,7B的参数,1B的推理成本训练代码、中间checkpoint、训练日志和训练数据都已经开源。尽管大语言模型(LM)在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权...
-
09-05大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-22支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结...

