新闻中心
-
05-25从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐在AI领域,扩展定律(Scalinglaws)是理解LM扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要...
-
05-24谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍今年2月,谷歌上线了多模态大模型Gemini1.5,通过工程和基础设施优化、MoE架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理...
-
05-24李彦宏欧洲谈AI:比起GPT-5,我更感兴趣超级应用中固AI与西方的最大区别是应用。中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。应用正在驱动中的AI的快速发展。应用领域的进步可以推动基础...
-
05-2370B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队70B模型,秒出1000token,换算成字符接近4000!研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍!不仅是快,...
-
05-23从Claude 3中提取数百万特征,首次详细理解大模型的「思维」刚刚,Anthropic宣布在理解人工智能模型内部运作机制方面取得重大进展。Anthropic已经确认了如何在ClaudeSonnet中表示征函数百万个概念。这...
-
05-23众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸大模型排行榜哪家强?还看LLM竞技场~截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。图片然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同...

