国产成人无码av在线播放不卡,欧美日韩国产中文精品字幕自在自线

GPU延遲對(duì)比：AMD RDNA2完勝NVIDIA安培

2021-04-20 08:59 快科技

關(guān)鍵詞：CPU GPU 物聯(lián)網(wǎng)

導(dǎo)讀：性能測(cè)試

CPU緩存與內(nèi)存延遲測(cè)試，相信大家都有所耳聞，但是GPU同樣的測(cè)試卻幾乎沒人做過。

Chips And Cheese就做了一次特別的測(cè)試，對(duì)比考察了AMD、NVIDIA GPU架構(gòu)的緩存、顯存遲問題。

首先是AMD RDNA2、NVIDIA Ampere兩家最新架構(gòu)的比拼，代表是RX 6900 XT、RTX 3090，前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了Infinity Cache無限緩存，提升帶寬的同時(shí)，延遲也可圈可點(diǎn)，二級(jí)緩存命中率上只增加了大約20ns的延遲，明顯低于Ampere。

更驚人的是，RDNA2顯存延遲和Ampere幾乎一模一樣，但是別忘了，Ampere只有兩個(gè)層級(jí)的緩存，RDNA2卻有四個(gè)。

Ampere的緩存架構(gòu)更加傳統(tǒng)，SM陣列私有一級(jí)緩存到二級(jí)緩存要增加超過100ns的延遲，RDNA2從零級(jí)緩存到二級(jí)緩存則只增加了約66ns?？雌饋?，GA102核心面積過大，也直接增加了延遲。

這正好可以解釋AMD RDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀，因?yàn)槎?jí)緩存、三級(jí)緩存延遲很低，更適合執(zhí)行較小的負(fù)載。Ampere則相反，高負(fù)載下優(yōu)勢(shì)明顯，比如說4K分辨率。

說完了GPU之間的對(duì)比，那么GPU、CPU放在一起怎么樣呢？這里以RX 6900 XT、Intel四代酷睿i7-4770為例來看看。

CPU的緩存自然不是一個(gè)級(jí)別的，所以這里Y軸用了線性數(shù)據(jù)，可以看到全程大大低于RDNA2，搭配DDR3-1600 CL9內(nèi)存延遲只有63ns，RX 6900 XT、GDDR6的組合則有226ns，另外末級(jí)緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIA GPU，包括Maxwell架構(gòu)的GTX 980 Ti、Pascal架構(gòu)的GTX 1080、Turing架構(gòu)的RTX 2060 Mobile。

Maxwell、Pascal其實(shí)差不多，前者整體略高一些，可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子，一級(jí)緩存延遲低得多，二級(jí)差不多，奇怪的是顯存延遲在32MB之后偏高，原因未知。

AMD考察了TeraScale架構(gòu)的HD 5850/6950、GCN架構(gòu)的HD 7970，再加上RX 6900 XT，很明顯在逐代降低，而且是各級(jí)緩存都在同時(shí)進(jìn)步。

GPU延遲對(duì)比：AMD RDNA2完勝NVIDIA安培

相關(guān)閱讀