新闻中心
-
09-06刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错快速更迭的开源大模型领域,又出现了新王:Reflection70B。横扫MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了GPT-4o,还击...
-
09-05第一个100%开源的MoE大模型,7B的参数,1B的推理成本训练代码、中间checkpoint、训练日志和训练数据都已经开源。尽管大语言模型(LM)在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权...
-
09-02Claude也变懒了!网友:学会给自己放假了开学将至,该收心的不止有即将开启新学期的同学,可能还有AI大模型。前段时间,Reddit上挤满了吐槽Claude越来越懒的网友。「它的水平下降了很多,经常停顿,...
-
08-22多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-11混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合混合专家,也得术业有专攻。对于目前的混合模态基础模型,常用的架构设计是融合特定模态的编码器或解码器,但这种方法存在局限:无法整合不同模态的信息,也难以输出包含多...
-
08-09通义千问开源Qwen2-Math,成为最先进的数学专项模型8月9日消息,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开...

