新闻中心

英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

2023-12-15
浏览次数:
返回列表

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

12月14日消息,amd于本月初推出了其最强的ai芯片instinct mi300x,其8-gpu服务器的ai性能比英伟达h100 8-gpu高出了60%。对此,英伟达于近日发布了一组最新的h100与mi300x的性能对比数据,展示了h100如何使用正确的软件提供比mi300x更快的ai性能。

根据AMD此前公布的数据显示,MI300X的FP8/FP16性能都达到了英伟达(NVIDIA)H100的1.3倍,运行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 服务器中,运行Llama 2 70B模型,MI300X比H100快了40%;运行Bloom 176B模型,MI300X比H100快了60%。

但是,需要指出的是,AMD在将MI300X 与 英伟达H100 进行比较时,AMD使用了最新的 ROCm 6.0 套件中的优化库(可支持最新的计算格式,例如 FP16、Bf16 和 FP8,包括 Sparsity等),才得到了这些数字。相比之下,对于英伟达H100则并未没有使用英伟达的 TensorRT-LLM 等优化软件加持情况下进行测试。

AMD对英伟达H100测试的隐含声明显示,使用vLLM v.02.2.2推理软件和英伟达DGX H100系统,Llama 2 70B查询的输入序列长度为2048,输出序列长度为128

英伟达最新发布的对于DGX H100(带有8个NVIDIA H100 Tensor Core GPU,带有80 GB HBM3)的测试结果显示,使用了公开的NVIDIA TensorRT LLM软件,其中v0.5.0用于Batch-1测试,v0.6.1用于延迟阈值测量。测试的工作量详细信息与之前进行的AMD测试相同

英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

根据结果显示,英伟达DGX H100服务器在使用优化的软件后,其性能提高了超过2倍,比AMD展示的MI300X 8-GPU服务器快了47%

DGX H100 在1.7秒内可以处理单个推理任务。为了优化响应时间和数据中心的吞吐量,云服务为特定的服务设置了固定的响应时间。这样他们可以将多个推理请求组合成更大的“Batch”,从而增加服务器每秒的总体推理次数。MLPerf 等行业标准基准测试也使用这个固定的响应时间指标来衡量性能

响应时间的微小权衡可能会导致服务器可以实时处理的推理请求数量产生不确定因素。使用固定的 2.5 秒响应时间预算,英伟达DGX H100 服务器每秒可以处理超过 5 个 Llama 2 70B 推理,而Batch-1每秒处理不到一个。

VALL-E VALL-E

VALL-E是一种用于文本到语音生成 (TTS) 的语言建模方法

VALL-E 134 查看详情 VALL-E

显然,英伟达使用这些新的基准测试是相对公平的,毕竟AMD也使用其优化的软件来评估其GPU的性能,所以为什么不在测试英伟达H100时也这样做呢?

要知道英伟达的软件堆栈围绕CUDA生态系统,经过多年的努力和开发,在人工智能市场拥有非常强大的地位,而AMD的ROCm 6.0是新的,尚未在现实场景中进行测试。

根据AMD之前透露的信息显示,其已经与微软、Meta等大公司达成了很大一部分交易,这些公司将其MI300X GPU视为英伟达H100解决方案的替代品。

AMD最新的Instinct MI300X预计将在2025年上半年大量出货,但是,届时英伟达更强的H200 GPU也将出货,2025下半年英伟达还将推出新一代的Blackwell B100。另外,英特尔也将会推出其新一代的AI芯片Gaudi 3。接下来,人工智能领域的竞争似乎会变得更加激烈。

编辑:芯智讯-浪客剑

以上就是英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!的详细内容,更多请关注其它相关文章!


# 英伟达 (nvidia)  # ai性能 (ai performance)  # llama  # amd  # 长度为  # 丹江口全网整合营销推广  # 自建网站和推广  # 外贸建设网站app设计  # 台州SEO优化案例  # 学校网站站外优化  # 福田在线网站推广的公司  # 美股  # 申请专利  # 的是  # 进行测试  # 基础设施  # 大涨  # 快了  # 加持  # 响应时间  # 南昌农产品网站建设公司  # 无为网站排名优化公司  # 新乡网站建设路隧道  # 湘潭市场营销推广公司 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 苹果16适合哪些机升级  数组和J*A怎么打  苹果16系统有哪些问题  估值水平比较中市盈率E是什么意思  如何提高import命令的性能  苹果16系统有哪些缺陷  恋爱软件免费聊天不收费的有哪些  市盈率百分位roe是什么意思  360n6锁屏壁纸怎么设置  如何4k对齐固态硬盘  手机拍显示屏有条纹怎么去除  复制 命令如何撤销  如何查看网站域名解析  净水器上的power是什么意思  33000日元等于多少人民币  网络光刻机是干什么用的  苹果16最近玩法有哪些  笔记本如何选择固态硬盘  12306放票时间规律(2025)  春运车票啥时候可以抢票  多少毫安的充电宝可以带上飞机  单片机怎么储存和显示  如何找出命令行  哪些库是typescript  哪个牌子的折叠屏手机好  折叠屏手机为什么有黑点  单片机引脚怎么改成上拉  5r是多少钱  python 如何执行linux命令  access中如何使用常用宏命令  怎么在项目中使用typescript  如何固态硬盘4k对齐  汽车的type-c接口是什么  如何学习typescript  typescript中如何定义json  热水器没热水显示power是什么意思  j*a中如何创建列表数组  轩逸e-power挡位b是什么意思  在遥控器中power是什么意思  如何查看邮件域名解析  怎么批量烧写单片机  车子上面nfc功能是什么意思  grep命令的是如何实现  苹果16关闭哪些功能好  苹果16都有哪些亮点  hive中datediff函数怎么用 Hive中DATEDIFF函数的使用指南  为什么夸克书架书单没了  如何查看bash内置的命令  三星固态硬盘如何安装  折叠屏手机好不好,耐不耐用 

搜索