傻大方


首页 > 潮·科技 > >

NVIDIA霸榜AI训练基准测试!三年性能涨超20倍


NVIDIA霸榜AI训练基准测试!三年性能涨超20倍
文章插图
芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西12月2日报道,今日,权威AI训练及推理性能基准测试MLPerf发布新一轮榜单。戴尔科技、浪潮、Supermicro以及首次亮相MLPerf的微软Azure创下训练AI模型的新速度记录。
这些厂商的共同特点是均采用NVIDIA AI。据统计,共有10家NVIDIA合作伙伴提交了本轮测试结果,其中包含8家OEM和2家云服务提供商。它们占所有提交的90%以上。
MLPerf行业基准测试组织成立于2018年5月,得到阿里巴巴、Arm、谷歌、英特尔和NVIDIA等数十家行业领先公司的支持,该测试透明、客观,因此对于评估AI平台和供应商参考价值很高。
其AI训练基准测试涵盖当今最热门的8个AI工作负载和场景,包括计算机视觉、语音识别、自然语言处理、推荐系统、增强学习等。
百度PaddlePaddle、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想和Supermicro等均提交了基于本地数据中心的单节点及多节点任务结果。
在今天宣布的MLPerf训练1.1结果中,NVIDIA平台在所有8项测试中都实现了最好的每芯片训练性能。NVIDIA AI也是唯一用于提交所有基准测试和用例的平台参与者。
NVIDIA霸榜AI训练基准测试!三年性能涨超20倍
文章插图
这是NVIDIA生态系统在MLPerf训练测试中的第五次亮相,也创造了迄今最好的表现。
NVIDIA希望用户借助他们选择的服务或系统以创纪录的速度训练模型。Selene是NVIDIA内部基于模块化NVIDIA DGX SuperPOD架构构建的AI超级计算机,借助NVIDIA InfiniBand网络和NVIDIA软件栈进行扩展,NVIDIA A100 GPU在Selene上实现了最快的AI训练速度 。
NVIDIA霸榜AI训练基准测试!三年性能涨超20倍
文章插图
因此,NVIDIA将NVIDIA AI与面向云服务、主机托管服务、企业和科学计算中心的产品相结合。
NVIDIA霸榜AI训练基准测试!三年性能涨超20倍】在OEM中,浪潮凭借其八路GPU服务器NF5688M6和NF5488A5液冷服务器在单节点性能方面创下了最多记录。戴尔和Supermicro在四路A100 GPU系统上创下了记录。
其中值得一提的是,微软Azure的NDm A100 v4实例是全球最快的云实例,其AI模型训练速度遥遥领先。它运行了新一轮的每项测试,扩展到多达2048个A100 GPU。
数据显示,自从三年前MLPerf测试首次亮相,NVIDIA的性能提高了20倍以上。过去一年半,NVIDIA A100 GPU的性能提升超过5倍。
NVIDIA霸榜AI训练基准测试!三年性能涨超20倍
文章插图
这种大规模加速源于NVIDIA在全栈GPU、网络、系统和软件方面取得的进步。尤其是软件方面的持续创新,这是NVIDIA目前工作的重心。
例如,借助一类新的内存复制操作,NVIDIA在针对医学成像的3D-UNet基准测试中实现2.5倍的操作加速。得益于微调GPU以进行并行处理的方式,NVIDIA在针对物体检测的Mask R-CNN测试中实现10%的速度提升,在针对推荐系统的测试中实现了27%的提升。NVIDIA只是重叠了独立操作,这种技术尤其适合跨多个GPU运行的作业。
NVIDIA还扩展了CUDA图形的使用范围,尽可能减少与主机CPU的通信。这使得NVIDIA在针对图像分类的ResNet-50基准测试中性能提升6%。
NVIDIA在用于优化GPU之间通信NCCL库上实施了两种新技术,这可将BERT等大型语言模型的结果加速高达5%。
总体而言,NVIDIA几乎所有的OEM合作伙伴都在NVIDIA认证系统上运行了测试,NVIDIA为需要加速计算的企业客户验证了服务器。
从提交的范围看来,NVIDIA平台对于各类模型、框架的通用性非常高,并能实现领先的性能表现以及扩展到任意规模,可以满足绝大多数下游客户对加速AI训练的算力需求。
当前NVIDIA使用的所有软件均在MLPerf仓库提供,NVIDIA不断将这些优化整合到NGC上的容器。这已在新的行业基准测试中得到验证,可从NVIDIA各种合作伙伴处获得,助力处理AI作业。


    猜你喜欢

  • r助力云端训练深度学习模型,亚马逊发布Trn1新实例
  • 职业|初中毕业加1年经验,你就可以申报国家初级AI训练师了
  • 智东西内参|Omniverse再升级,五大关键技术揭秘英伟达的元宇宙布局「附下载」| nvidia
  • |好,AI训练师国家职业标准来了,学人工智能的准备考证吧
  • 英伟达|NVIDIA RTX 4070显卡将涨价,涨幅10%
  • RTX2060|NVIDIA RTX 3050桌面版预计明年Q2发布,性能可达RTX 2060
  • cuda|NVIDIA 20G显存新卡公布,CUDA核心、显存位宽都被大砍一刀
  • 英伟达|NVIDIA CMP 170HX顶级矿卡首测:散热极尽奢侈
  • 华为p10|20GB旗舰级效能! Nvidia发布两款全新“专业级”显示卡
  • 英伟达|NVIDIA:我们的GPU显卡比CPU节能42倍

  • 上一篇:腾讯|微信、支付宝个人收费码遭叫停,移卡们的新增长故事来了吗?

    下一篇:华为|米粉最喜欢3部手机,每部都是“神机”,网友:“双系列”是真香