新闻中心
-
04-26Eagle 2.5— 英伟达推出的视觉语言模型Eagle2.5是由英伟达推出的一款专注于长上下文多模态学习的视觉语言模型,拥有8B的参数规模。尽管参数量较小,但其在处理高分辨率图像和长视频序列方面表现出色,...
-
04-23RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理清华和上交的最新论文中,上演了一场“学术打假”的戏码。文中研究者们对当前“纯RL有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验,他们证明引入...
-
04-23ChatTS-14B— 字节开源的时间序列理解和推理大模型ChatTS-14B是什么ChatTS-14B是字节跳动研究团队开源的专注于时间序列理解和推理的大型语言模型,参数量达140亿。基于Qwen2.5-14B-In...
-
04-23Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?昨天一早,Meta了放出自家用了20万显卡集群训练出的Llama4系列模型,其中包括Llama4Scout、Llama4Maverick和Llama4Behem...
-
04-14ScholarCopilot— 滑铁卢与卡内基梅隆大学联合推出的AI学术写作助手ScholarCopilot是什么ScholarCopilot是加拿大滑铁卢大学与卡内基梅隆大学的研究团队开发的专为学术写作设计的人工智能工具,基于Qwen-2...
-
04-11OmniSVG— 复旦大学联合 StepFun 推出端到端多模态矢量图形生成模型OmniSVG:全球首个端到端多模态SVG生成模型OmniSVG是由复旦大学和StepFun联合研发的全球首个端到端多模态可缩放矢量图形(SVG)生成模型。它基...

