CPU缓存与内存延迟测试|你从未见过的GPU另类对比:AMD完胜NVIDIA!
CPU缓存与内存延迟测试 , 相信大家都有所耳闻 , 但是GPU同样的测试却几乎没人做过 。
ChipsAndCheese就做了一次特别的测试 , 对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题 。
文章图片
首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼 , 代表是RX6900XT、RTX3090 , 前者在几乎所有阶段都完胜 。
RNDA2架构创新性地加入了InfinityCache无限缓存 , 提升带宽的同时 , 延迟也可圈可点 , 二级缓存命中率上只增加了大约20ns的延迟 , 明显低于Ampere 。
更惊人的是 , RDNA2显存延迟和Ampere几乎一模一样 , 但是别忘了 , Ampere只有两个层级的缓存 , RDNA2却有四个 。
Ampere的缓存架构更加传统 , SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟 , RDNA2从零级缓存到二级缓存则只增加了约66ns 。 看起来 , GA102核心面积过大 , 也直接增加了延迟 。
这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀 , 因为二级缓存、三级缓存延迟很低 , 更适合执行较小的负载 。 Ampere则相反 , 高负载下优势明显 , 比如说4K分辨率 。
文章图片
【CPU缓存与内存延迟测试|你从未见过的GPU另类对比:AMD完胜NVIDIA!】说完了GPU之间的对比 , 那么GPU、CPU放在一起怎么样呢?这里以RX6900XT、Intel四代酷睿i7-4770为例来看看 。
CPU的缓存自然不是一个级别的 , 所以这里Y轴用了线性数据 , 可以看到全程大大低于RDNA2 , 搭配DDR3-1600CL9内存延迟只有63ns , RX6900XT、GDDR6的组合则有226ns , 另外末级缓存平均延迟分别是53.42ns、123.2ns 。
文章图片
再看看前几代的NVIDIAGPU , 包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile 。
Maxwell、Pascal其实差不多 , 前者整体略高一些 , 可能是受制于芯片面积较大、核心频率较低 。
Turing则已经有了Ampere的样子 , 一级缓存延迟低得多 , 二级差不多 , 奇怪的是显存延迟在32MB之后偏高 , 原因未知 。
文章图片
AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970 , 再加上RX6900XT , 很明显在逐代降低 , 而且是各级缓存都在同时进步 。
- 月球背面有外星人?嫦娥与玉兔联手破谣言,证明月球是“广寒宫”
- 华耐家居《无尽攀登》,登山家与企业共通的硬核攀登精神
- 这一只黑猩猩已经基因突变,差点变成人,它们与人类只差1.2%
- 新型变异毒株与艾滋病有关?美国这次罕见快速反应,钟南山也发
- 宝马香车、豪宅大院|方寸之间兼具儒雅与时尚——东易日盛270平米新中式风格大宅装修赏析
- 张红雷:为什么说周期型行业与科技型行业是白送钱的行业。
- 钛加工材需要经过复杂的工艺制得|2021年中国钛材市场供给现状与细分市场分析 板材型钛材产量占比最高【组图】
- 对于买房与否|买房和不买房的人,20年后有区别吗?哪一种会过得更幸福呢?
- 36氪独家 | 三坑大型集合店品牌「诗与万花镜」完成数千万元Pre-A轮融资,两个月内连续完成两轮融资,总融资金额近亿元
- 蔚来与壳牌合作建设充电桩 百度Apollo获得首张自动驾驶运营牌照