新闻中心
-
01-29原来,这些顶级大模型都是蒸馏的中国科学院深圳先进技术研究院、北京大学和零一万物等机构的研究人员在一篇新论文中指出,除了Claude、豆包和Gemini外,许多知名的闭源和开源大型语言模型(L...
-
01-27阿里云通义开源长文本模型及推理框架,百万Tokens处理速度提升近7倍阿里云重磅开源Qwen2.5-1M大模型,支持百万Tokens上下文!该模型提供7B和14B两种尺寸,在处理长文本任务中显著超越GPT-4o-mini。阿里云还...
-
01-25年末惊喜!ByteDance Research视频理解大模型「眼镜猴」正式发布字节跳动研究团队的视频理解大模型Tarsier迎来了重大升级,推出了第二代模型Tarsier2及其技术报告。此前发布的Tarsier-7B/34B已成为最强大的...
-
01-24最懂医疗的国产推理大模型,果然来自百川智能年末将至,全球AI大模型竞争骤然白热化。本周,Kimi模型开启强化学习新范式,DeepSeekR1以开源姿态“接棒”OpenAI,谷歌则将Gemini2.0Fl...
-
01-23用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐AIxiv专栏:北京交通大学ADaM团队探索系统2对齐,提升大模型安全性北京交通大学ADaM团队长期关注AI安全领域,此前已开源o1复现项目o1-Coder(h...
-
01-22OS-Genesis来了,自动收集和标注Agent数据,高效且多样机智客AIxiv专栏持续发布前沿学术与技术内容。多年来,已报道2000余篇来自全球顶尖高校和企业实验室的成果,有力推动学术交流与传播。欢迎优秀研究者投稿或联系报...

