工程_第2页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

03-02

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

大型语言模型（LLM）在执行任务时也可能面临“过度思考”的困境，导致效率低下甚至失败。近期，来自加州大学伯克利分校、UIUC、ETHZurich和CMU等机构的...
02-28

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

AIxiv专栏持续关注并报道全球顶尖AI研究成果。多年来，我们已发布超过2000篇学术及技术文章，涵盖众多高校和企业实验室的领先研究。欢迎优秀研究者投稿或联系我...
02-28

ICLR 2025｜浙大、千问发布预训练数据管理器DataMan，53页细节满满

DataMan：提升大语言模型预训练效率的数据管理器AIxiv专栏持续报道全球顶尖AI研究成果。本文介绍由浙江大学和阿里巴巴千问团队合作完成的一项研究，该研究针...
02-28

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

谷歌发布超高难度AI基准测试：BIG-BenchExtraHard(BBEH)，挑战现有模型极限！近期，谷歌推出全新AI基准测试BBEH，其难度远超现有基准，旨...
02-27

无编码器架构潜力或被低估，首个无编码器3D多模态LLM大模型来了

AIxiv专栏：探索无编码器架构在3D大型多模态模型中的潜力AIxiv专栏持续报道全球顶尖AI研究成果，已收录2000余篇来自高校和企业实验室的学术技术文章。欢...
02-26

千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限

2025年，视频生成技术，特别是基于扩散模型的视频生成，持续发展创新，涌现出众多令人惊艳的文生视频和图生视频模型。然而，长视频生成一直是该领域的一大难题。麻省理...

: 电话

: 客服

: 地图

: 搜索