新闻中心
-
07-23首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了快准备好你的GPU!Llama3.1终于现身了,不过出处却不是Meta官方。今日,Reddit上新版Llama大模型泄露的消息遭到了疯传,除了基础模型,还包括8...
-
06-17英伟达开源最强通用模型Nemotron-4 340B性能超越Llama-3,主要用于合成数据。英伟达的通用大模型Nemotron,开源了最新的3400亿参数版本。本周五,英伟达宣布推出Nemotron-4340B...
-
06-12Yandex 开源 LLM 训练工具节省高达 20% 的 GPU 资源Yandex跨国科技公司最近推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强GPU通信并减...
-
06-06使用Rag和Sem-Rag提供上下文增强AI编码助手通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContex...
-
05-31一文读懂构建多代理的 AutoGen 开源框架Hellofolks,我是Luga,今天我们来聊一下人工智能(AI)生态领域相关的技术-AutoGen-一个统一的多代理对话框架。想象一下这样一个场景:我们不再...
-
05-30速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型对标OpenAI的法国AI独角兽MistralAI有了新动作:首个代码大模型Codestral诞生了。作为一个专为代码生成任务设计的开放式生成AI模型,Code...

