新闻中心
-
08-08Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态...
-
08-06算法、系统和应用,三个视角全面读懂混合专家(MoE)LLM很强,而为了实现LLM的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型...
-
08-05能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径文本大模型卷出新高度,Claude3在数学、编程、多语言理解、视觉等多个维度超越GPT-4和上线不足一个月的Gemini1.0Ultra。「日新月异」已经不足以...
-
08-02Poe 的新功能好强 !编程0基础,也能10分钟整出一个梗图编辑器机器之能报道编辑:Sia国内大模型是不是要迅速跟上?最近,「北美知乎」问答社区Quora旗下的AI聊天平台Poe,推出了一项名为「Previews」的新功能。有...
-
07-31揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad...
-
07-26谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back对于AI来说,奥数不再是问题了。本周四,谷歌DeepMind的人工智能完成了一项壮举:用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥。...

