新闻中心

OpenAI等AI公司竞相利用“蒸馏”技术 构建低成本模型

2025-03-03
浏览次数:
返回列表

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

openai等ai公司竞相利用“蒸馏”技术 构建低成本模型

全球领先的人工智能公司,包括OpenAI、微软和Meta,正积极采用“模型蒸馏”技术,致力于打造更经济实惠的AI模型,惠及消费者和企业。

DeepSeek公司在中国利用这项技术,基于Meta和阿里巴巴发布的开源系统,成功构建了高效强大的AI模型,此举引发业界广泛关注,并对硅谷AI的领先地位造成冲击,导致美国大型科技股市值大幅缩水。

模型蒸馏的核心在于利用大型语言模型(“教师”模型)生成数据,训练较小的“学生”模型,从而高效地将大型模型的知识和预测能力转移到小型模型中。“教师”模型负责预测句子中下一个可能的单词。

虽然蒸馏技术已存在多年,但近期突破使其在构建高性价比AI应用方面展现出巨大潜力,备受初创企业青睐。

OpenAI平台产品负责人Olivier Godement表示:“蒸馏技术非常神奇,它能利用大型前沿模型来训练小型模型,使其在特定任务上表现出色,同时成本低廉、速度极快。”

大型语言模型(如OpenAI的GPT-4、谷歌的Gemini和Meta的Llama)的开发和维护需要海量数据和计算资源,成本可能高达数亿美元。而蒸馏技术则允许开发者和企业以更低的价格获得这些模型的功能,甚至可在笔记本电脑和智能手机等设备上快速运行AI模型。

OpenAI的平台支持模型蒸馏,开发者可从中学习支撑ChatGPT等产品的大型语言模型的知识。微软作为OpenAI的主要投资者,已利用GPT-4对旗下Phi系列小型语言模型进行蒸馏。然而,OpenAI声称DeepSeek违反服务条款,利用其模型训练竞争对手的模型,DeepSeek对此尚未回应。

专家指出,虽然蒸馏技术能创建高性能模型,但其能力相对有限。“模型越小,能力就不可避免地降低,”微软研究院的Ahmed Awadallah解释道,一个蒸馏模型可能擅长总结邮件,但并不适用于其他任务。

Zyro AI Background Remover Zyro AI Background Remover

Zyro推出的AI图片背景移除工具

Zyro AI Background Remover 145 查看详情 Zyro AI Background Remover

IBM研究院AI模型副总裁D*id Cox认为,大多数企业无需庞大的模型,蒸馏模型已足够满足客服聊天机器人或小型设备上的应用需求。“如果能降低成本并达到预期性能,几乎没有理由不采用蒸馏技术。”

这给许多领先AI公司的商业模式带来挑战。即使开发者使用OpenAI等公司提供的蒸馏模型,其运行和创建成本也远低于大型模型,导致收入减少。模型制造商通常会对蒸馏模型收取较低费用,因为其计算负载较低。

然而,OpenAI的Godement认为,大型语言模型仍将用于“高智能和高风险任务”,企业愿意为高精度和可靠性支付更多费用。大型模型也将用于探索新的能力,然后将其蒸馏到小型模型中。

Contextual AI首席执行官Douwe Kiela表示:“OpenAI长期以来试图阻止模型蒸馏,但很难完全避免。”

蒸馏技术也为开源模型倡导者带来了胜利,DeepSeek也将其最新模型开源。Meta首席AI科学家Yann LeCun表示:“这就是开源的精髓,开放的流程能使每个人都受益。”

蒸馏技术意味着,即使模型制造商投入巨资提升AI系统能力,也可能面临竞争对手的快速追赶,DeepSeek的案例便是明证。大型语言模型能力在几个月内即可被复制,这引发了对大型语言模型先发优势的质疑。

IBM的Cox总结道:“在这个瞬息万变的领域,你可能投入巨资艰难地开发模型,然后其他人迅速跟进,这是一个复杂且有趣的商业格局。”

以上就是OpenAI等AI公司竞相利用“蒸馏”技术 构建低成本模型的详细内容,更多请关注其它相关文章!


# 网易  # 纯线上花店营销推广方案  # 建设公众号网站  # 东莞市建设小学网站  # 嘉兴seo软件推广  # 清酒营销推广计划书怎么写  # yoast seo增加关键字  # 重庆网站建设网址  # 企业网站建设内容包括  # 应聘SEO会问哪些问题  # 开通蓝v可以推广营销吗  # 你该  # 美图  # 竞争对手  # 较低  # ai  # 使其  # 也将  # 低成本  # 微软  # 开源  # llama  # gem  # gemini  # chatgpt  # 电脑  # 谷歌  # openai  # deepseek 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 开机如何运行dos命令提示符  如何固态硬盘4k对齐  windows 如何连接ftp命令行  ai显示无法找到链接的文件是什么意思  春运返程如何抢票成功  手机换电池要多少钱  early什么意思  复制 命令如何撤销  make命令如何使用  如何学好typescript  cos150度等于多少  远程桌面如何发送命令  类似微信的聊天软件有哪些  如何查询固态硬盘序列  url解码什么意思  NoSQL数据库有哪些特点  汽车收音机power是什么意思  j*a中数组怎么传递  尼桑越野车中控前power是什么意思  如何查看固态硬盘速度  怎么批量烧写单片机  苹果16哪些型号好  单片机怎么控制内功率  j*a map数组怎么取值  手机如何ip绑定域名解析  如何提高固态硬盘速度  16苹果有哪些机型  苹果16有哪些不同  bugly是什么  折叠屏手机为什么有黑点  学typescript需要多久  360n4怎么关闭锁屏壁纸  笔记本电脑多少钱  春运预约抢票能抢到吗  苹果16自带配件有哪些  空调控制面板power灯一直亮是什么意思  db2命令中如何去到指定的副本  wps中datediff函数怎么用 WPS中DATEDIFF函数的语法和用法分享  苹果16粉色还有哪些机型  65寸电视长宽多少厘米  折叠手机内屏为什么会坏  ftp$如何执行宏命令  vue项目如何用typescript  j*a怎么创建json数组  镜像ao3链接入口  爱奇艺视频怎么下载到手机u盘怎么转换格式方法  苹果16改进了哪些  爱玛电动车power模式是什么意思  360n7lite怎么设置动态壁纸  爱奇艺会员qq登录可以几个人用? 

搜索