新闻中心
-
07-03清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳2020年12月发布的CPM-1是国内首个中文大模型;2022年9月发布的CPM-Ant仅微调0.06%参数就能超越全参数微调效果;2023年5月发布的WebC...
-
06-30田渊栋团队新研究:微调在大家不断升级迭代自家大模型的时候,LLM(大语言模型)对上下文窗口的处理能力,也成为一个重要评估指标。比如OpenAI的gpt-3.5-turbo提供16kt...
-
06-28羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品开源羊驼大模型LLaMA上下文追平GPT-4,只需要一个简单改动!MetaAI这篇刚刚提交的论文表示,LLaMA上下文窗口从2k扩展到32k后只需要小于1000...
-
06-27轻量级的深度学习框架TinygradTinygrad是一个轻量级的深度学习库,它提供了一种简化和直观的方法来理解和实现神经网络。在本文中,我们将探讨Tinygrad及其主要功能,以及它如何成为那些...
-
06-26中国最强AI研究院的大模型为何迟到了出品|虎嗅科技组作者|齐健编辑|陈伊凡头图|FlagStudio“OpenAI会再开源大模型吗?”当智源研究院理事长张宏江向线上参加2023年智源大会的Open...
-
06-20650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了在大模型方向上,科技巨头在训更大的模型,学界则在想办法搞优化。最近,优化算力的方法又上升到了新的高度。大型语言模型(LLM)彻底改变了自然语言处理(NLP)领域...

