2080Ti性能是GTX480的16倍性能提升到了1298%

2020-10-16 09:06:42 來源：太平洋電腦網(wǎng)

看過我們之前十年旗艦N卡橫評(píng)(點(diǎn)擊這里可以跳轉(zhuǎn))的朋友，可能都會(huì)感慨半導(dǎo)體行業(yè)的神速發(fā)展，從GTX 480到RTX 2080 Ti，性能提升到了1298%!

看過我們之前十年旗艦N卡橫評(píng)(點(diǎn)擊這里可以跳轉(zhuǎn))的朋友，可能都會(huì)感慨半導(dǎo)體行業(yè)的神速發(fā)展，從GTX 480到RTX 2080 Ti，性能提升到了1298%!

也有朋友吐槽RTX 20對(duì)比GTX 10提升不大，但是，在老黃發(fā)布RTX 30后，那價(jià)格，那性能，真香!

同時(shí)這也引發(fā)了圈內(nèi)一大波的連鎖效應(yīng)，RTX 2080 Ti二手價(jià)格一夜腰斬,相關(guān)的段子和弔圖也鋪得滿天都是，不過關(guān)于RTX 3080的評(píng)測(cè)相信大家已經(jīng)看過不少，今天我們就帶來更為直觀的RTX 3080評(píng)測(cè)視頻。

視頻不僅有3080的全面測(cè)試，還有對(duì)比十年前GTX480等特別的項(xiàng)目，大家耐心看就知道啦。

當(dāng)然了假如你不喜歡看視頻，或者流量捉雞，我們也有文字版本～

NVIDIAAmpere架構(gòu)解析-CUDA流處理器翻倍提升的秘密

有的朋友可能想到了，那么晶體管翻倍是不是就是流處理器翻倍的原因呢?你答對(duì)了一點(diǎn)點(diǎn)，晶體管暴增讓GA102核心擁有84組SM計(jì)算單元，比上一代的TU102多了12組，但我們這次評(píng)測(cè)的3080和2080 Ti SM單元一樣僅有72組，但CUDA核心數(shù)目還是翻倍了

根本原因是這次老黃改變了N卡流處理器的運(yùn)算模式。

想搞清楚這點(diǎn)我們首先要知道顯卡運(yùn)算一般分為整數(shù)運(yùn)算(Integer)和浮點(diǎn)運(yùn)算(floatingpoint)兩種，而浮點(diǎn)運(yùn)算可以分為半精度(FP16)、單精度(FP32)、雙精度(FP64)，整數(shù)運(yùn)算也可以這樣劃分。

與游戲最密切相關(guān)的就是FP32運(yùn)算，其次是INT32，從費(fèi)米架構(gòu)以來NV就把顯卡專門做FP32的運(yùn)算單元叫做CUDA核心，因此以往我們可以根據(jù)CUDA核心的數(shù)量來比較N卡性能，但是做其他運(yùn)算的流處理器數(shù)量NV并沒有統(tǒng)計(jì)

那么總流處理器數(shù)怎么算的呢?

以2080 Ti TU102核心圖為例，完整的TU102有6組GPC圖形簇，每組GPC有12組SM單元。

再放大一點(diǎn)這里我們能看到每組SM又能劃分為四個(gè)小組，每個(gè)小方格代表一個(gè)運(yùn)算單元，因此一個(gè)模塊有16個(gè)進(jìn)行FP32運(yùn)算的cuda單元，和16個(gè)進(jìn)行INT32運(yùn)算的單元，還有個(gè)Tensor Croes，一個(gè)SM總共64個(gè)CUDA運(yùn)算單元和64個(gè)INT32運(yùn)算單元，4個(gè)tensorCores和1個(gè)RTCores，這是圖靈架構(gòu)的細(xì)節(jié)，所以TU102總共有64*12*6共4608個(gè)cuda核心和4608個(gè)INT32運(yùn)算單元。

到了NVIDIAAmpere架構(gòu)，大家能發(fā)現(xiàn)這里原本的16個(gè)INT32單元也能進(jìn)行FP32運(yùn)算，右邊的FP32單元保持不變，所以這樣一個(gè)小分區(qū)里一個(gè)運(yùn)算周期內(nèi)顯卡可以選擇做16個(gè)FP32運(yùn)算+16個(gè)INT32運(yùn)算或者做16FP32+16FP32共32個(gè)FP32運(yùn)算。

因此按照N卡能做FP32運(yùn)算的單元就是CUDA核心的算法，這里一個(gè)SM單元的CUDA流處理器數(shù)目就翻倍到128個(gè)了。

這樣做能讓顯卡在單純跑FP32浮點(diǎn)運(yùn)算時(shí)性能翻倍，但是顯卡在游戲中是不可能只做浮點(diǎn)運(yùn)算的，這也是為什么3080對(duì)比2080 Ti CUDA數(shù)目翻倍，但游戲性能并不會(huì)翻倍的原因。

除了CUDA核心數(shù)目提升，顯存帶寬提升也是RTX30性能暴漲的一大原因，3080和3090采用了鎂光新一代的GDDR6X顯存，新顯存加入PAM4信令機(jī)制，讓每周期傳輸?shù)臄?shù)據(jù)量翻倍，大家可以理解為SLC到MLC那樣的升級(jí)。

新的顯存其速率達(dá)到了19Gbps和19.5Gbps，根據(jù)顯存帶寬等于顯存速率 x 位寬除以8,3080的顯存帶寬達(dá)到了760GB/s，3090更是達(dá)到了驚人的936GB/s，對(duì)比2080 Ti提升了24%和52%。

其他方面呢，比如PCIE4.0與RTXIO、HDMI2.1這些就不詳細(xì)介紹了。

但是這次公版設(shè)計(jì)，還是獲得我們的一致好評(píng)，不得不佩服NVIDIA的工業(yè)設(shè)計(jì)能力，看到官方渲染圖的時(shí)候，我們都嘖嘖稱奇，有人說沒必要，也有人說這是藝術(shù)品。

直到我們看到它滿載78℃與裸機(jī)48分貝噪音的測(cè)試結(jié)果的時(shí)候，整個(gè)猛男團(tuán)隊(duì)都跪服了，這個(gè)異形PCB實(shí)在是太有必要了。也只有這樣的設(shè)計(jì)，才能用上這種雙軸流通式散熱器。

第二部分，為什么這次它叫RTX 3090，而不是RTX3080 Ti？

這部分單純是我們的猜測(cè)，如有雷同實(shí)屬巧合，以后發(fā)現(xiàn)猜錯(cuò)了再回來打我們臉吧

猜測(cè)1：雖然AMD遲遲沒有出招，皮衣刀客老黃的實(shí)力可不是蓋的，這次算了算差不多是AMD再怎么蓄力都觸碰不了的高度，出了張新卡，直接給它命名90吧，既能給AMD一個(gè)震懾作用，又能把價(jià)格定得更高，畢竟是90嘛，怎么也得比80Ti賣貴一些呀，好了，大家乖乖掏錢。

猜測(cè)2：在頂級(jí)位置安排一個(gè)高定價(jià)的RTX3090，能顯得RTX3080性價(jià)比很高，畢竟看規(guī)格有80%的性能，可價(jià)格還不到一半，是不是很香?預(yù)計(jì)第一批貨會(huì)秒沒。

猜測(cè)3：在RTX3090和3080之間還有很多刀的空間，比如RTX3080可以加點(diǎn)流處理器，加點(diǎn)顯存，做成RTX3080Ti或者3080S作為后手招呼AMD10月28日要發(fā)的大Navi，畢竟這5499和11999之間還有6000多塊錢的差價(jià)。

而且從老黃在發(fā)布會(huì)上的說法來看，R

對(duì)了，就算是RTX3090也不是完整版，參照我們前面的算法，完整版GA102是有10752個(gè)流處理器的，老黃只開了10496個(gè)。

反正無論如何，老黃還留了個(gè)超級(jí)后手，…真不愧是皮衣刀客，刀法如此精妙，猛男團(tuán)佩服佩服。

第三部分，十年顯卡性能增長(zhǎng)多少？

3090還沒解禁，目前3080也算是這十年來NVIDIA游戲顯卡市場(chǎng)中最強(qiáng)的單芯卡了，立馬實(shí)測(cè)一波

測(cè)試平臺(tái)和項(xiàng)目與上期一致，大家看表格就好。

評(píng)測(cè)平臺(tái)操作系統(tǒng)Windows 10 1909 Pro Workstations 18363.720CPUi7-10700K主板華碩ROG M12E內(nèi)存影馳HOF EXTREME 設(shè)置在3600MHz8GB X 2SSD三星 970 Evo Plus 1TB電源昆侖KL-1080W電源水冷散熱器超頻三凌鏡GI-CX360水冷散熱器

理論性能測(cè)試方面RTX3080平均四項(xiàng)對(duì)比2080Ti提升了28%，對(duì)比2080提升了65%。

在游戲方面，麻煩又來了，因?yàn)?080性能實(shí)在太強(qiáng)，即使我們開了全高畫質(zhì)，很多游戲比如吃雞在1080P下CPU還是出現(xiàn)瓶頸了，3080對(duì)比2080Ti的提升只有幾幀。

很多小機(jī)靈鬼在上期視頻曾經(jīng)質(zhì)疑我們，怎么不用10900K呢?其實(shí)看過我們十代酷睿評(píng)測(cè)這期的網(wǎng)友就知道和10700K差不多性能的9900K游戲?qū)Ρ?0900K也就弱了7%,不能根本性解決問題該瓶頸還是瓶頸。

這也側(cè)面說明了，目前CPU的游戲性能增長(zhǎng)已經(jīng)趕不上GPU游戲性能的增長(zhǎng)了，大家手動(dòng)艾特牙膏廠進(jìn)來挨打!

最后剔除掉有問題的數(shù)據(jù)，最終3080對(duì)比2080 Ti提升22%，對(duì)比480提升到了1584%，整機(jī)平臺(tái)功耗上漲了133W。

但是顯然用這種測(cè)試方法來給RTX 3080對(duì)比RTX 2080 Ti的提升下結(jié)論，是不夠全面的，主要有三個(gè)槽點(diǎn)。

RTX30系顯卡是支持PCIe 4.0的顯卡，你這里用PCIe 3.0的平臺(tái)會(huì)不會(huì)限制顯卡性能發(fā)揮?

剛剛也說了1080P下很多游戲中CPU已經(jīng)成為瓶頸，而且買這個(gè)性能顯卡的玩家大部分也不會(huì)在1080P下玩游戲了，對(duì)比2K游戲和4K游戲性能會(huì)更為靠譜。

第三，我們這里為了讓10年前的顯卡都能和3080在同一條賽道上比賽，用的都是老游戲，但是DX12新游戲，特別是包含光線追蹤和DLSS支持的新游戲才是兩者差距所在，才能體現(xiàn)30系第二代RT Cores和TensorCores的威力。所以我們?cè)賮韨€(gè)加時(shí)賽，專門讓3080、2080Ti、2080SUPER和2080和進(jìn)行PK。

第四部分：PCIe4.0顯卡用在3.0平臺(tái)有沒瓶頸？

其實(shí)在老黃開發(fā)布會(huì)官方演示的PPT中，他們就是使用酷睿i9進(jìn)行測(cè)試的，光是這點(diǎn)，你們就不用擔(dān)心PCIe3.0夠不夠用的問題了。但猛男抱著實(shí)事求是的態(tài)度，還是拿支持PCIe4.0的AMDRyzen93900XT與X570作為平臺(tái)再測(cè)一遍對(duì)比一下。

雖然兩者跑3DMark的帶寬測(cè)試有差距，但是多個(gè)理論性能測(cè)試項(xiàng)目中，兩者都沒有明顯的差異，因此我們可以得到結(jié)論P(yáng)CIe3.0×16的帶寬是完全能滿足RTX3080對(duì)帶寬的需求的。

但是，我這個(gè)結(jié)論只針對(duì)單卡用途啊，因?yàn)镽TX3080是不支持雙路SLI的，而RTX3090則是支持SLI的，如果在Z490這種消費(fèi)平臺(tái)PCIe3.0主板上進(jìn)行雙路SLI的話，那每路就只能拿到PCIe3.0×8的通道了，在那個(gè)時(shí)候就可能出現(xiàn)瓶頸了。

第五部分，加入DX12游戲，更全面的性能測(cè)試

針對(duì)第二點(diǎn)我們先追加了三項(xiàng)理論性能測(cè)試，分別是更嚴(yán)苛的DX12測(cè)試場(chǎng)景TimeSpyExtreme、光追性能測(cè)試PortRoyal和DLSS測(cè)試，這里3080對(duì)比2080Ti也是保持30%左右的性能優(yōu)勢(shì)。

除此以外我們還準(zhǔn)備了6個(gè)新游戲進(jìn)行測(cè)試其中有5個(gè)支持光線追蹤和DLSS，這里只看它們?cè)?K和4K分辨率下的表現(xiàn)，各項(xiàng)測(cè)試中3080對(duì)比2080Ti都有明顯的優(yōu)勢(shì)。

在毀滅戰(zhàn)士4k分辨率測(cè)試時(shí)優(yōu)勢(shì)最明顯，達(dá)到43%，平均下來也有30%左右的提升，而對(duì)比2080提升最大則在德軍總部4k分辨率測(cè)試中，這里顯然2080和2080SUPER就爆顯存了，幀數(shù)只有30801/3。

結(jié)合此前6個(gè)舊游戲中這四張顯卡在2K、4K分辨率的成績(jī)，最后我們就能得到這張全面的性能百分比圖表。

12個(gè)游戲，兩個(gè)分辨率，9項(xiàng)理論性能測(cè)試，這33項(xiàng)測(cè)試得出的這張性能百分比圖表應(yīng)該算非常全面和具有參考價(jià)值的了，RTX3080對(duì)比RTX2080Ti提升為28%，對(duì)比2080SUPER提升56%，對(duì)比2080提升足足有71%。

第六部分，對(duì)比目前最強(qiáng)A卡，簡(jiǎn)直是屠殺..

雖然現(xiàn)在市面上的A卡比較弱雞，但作為NV目前唯一的對(duì)手，這里我還是要象征性拿出幾張A卡出來鞭尸，這里我們選用了RadeonVII和5700XT兩張顯卡，因?yàn)槲覀儼l(fā)現(xiàn)雖然理論性能RadeonVII是目前最強(qiáng)的A卡，但是GCN架構(gòu)實(shí)在太老了，在很多新游戲中RadeonVII的表現(xiàn)反而不如5700XT，因此我們索性兩張顯卡都加入測(cè)試。

測(cè)試項(xiàng)目是12項(xiàng)游戲中不涉及光追和DLSS的7個(gè)游戲，最終3080比RadeonVII強(qiáng)了82%，對(duì)比RX5700XT強(qiáng)了93%，接近翻倍

測(cè)試結(jié)果看完,相信每一個(gè)A粉都?jí)毫ι酱螅贿^蘇媽給了大家點(diǎn)信心，根據(jù)泄露的消息，BIGNAVI采用RDNA2架構(gòu)，命名6800或者6900XT，10月28日發(fā)布，屆時(shí)我們?cè)賮砜纯醇t綠兩家的PK。

第7部分，功耗溫度測(cè)試、噪音測(cè)試、延遲測(cè)試

RTX30系使用的是三星特制8nm工藝，顯卡的功耗表現(xiàn)如何呢?這里我們使用了一套很牛逼的設(shè)備，由NVIDIA提供能通過PCIe插槽供電和外接供電直接讀出顯卡單獨(dú)的功耗，3080的功耗比2080Ti要高了30~60W，能耗比對(duì)比2080Ti高了7%。

這樣看新顯卡的工藝還是有點(diǎn)拉跨，其實(shí)三星8nm工藝確實(shí)在密度上是比不上臺(tái)積電的7nm工藝的，老黃用它也是勝在便宜，最后3080的價(jià)格也確實(shí)讓人驚喜。

顯卡的噪音也非常不錯(cuò)，50分貝以下根本沒有感覺。

在RTX30系發(fā)布會(huì)上老黃還提到了一個(gè)降低顯卡延遲的技術(shù)Reflex這里我們也檢測(cè)了一下新顯卡在堡壘之夜游戲中的延遲情況，打開Reflex后在畫面延遲確實(shí)有所降低，而且分辨率越高療效越明顯，對(duì)職業(yè)電競(jìng)玩家的確實(shí)是個(gè)好東西，只是對(duì)于曉邊我來說可能就感知不強(qiáng)了。

總結(jié)

3080的性能提升足夠讓人驚喜，當(dāng)然最令我驚訝的是價(jià)格，畢竟此前的消息一直都說RTX30系要繼續(xù)漲價(jià)，唯一的槽點(diǎn)就是功耗也增長(zhǎng)了不少，但前面也說了，假如不是用三星8nm工藝，新顯卡的價(jià)格也不會(huì)那么出人意料，算是一把雙刃劍吧，大家記得選購(gòu)靠譜的電源就好。

再?gòu)氖晏嵘那€也能看出，在RTX20劃了兩年水之后，在心疼買了20系的小伙伴之余，也能欣慰地看到這代RTX 30系的提升開始回到了正軌，而對(duì)于RTX 3090顯卡，性能從它的規(guī)格來看也大致推算出會(huì)比3080強(qiáng)20%左右，八九不離十了。

如果說英偉達(dá)圖靈架構(gòu)的RTX20是試水光追的一代，那么英偉達(dá)安培架構(gòu)的RTX30就是揚(yáng)帆起航的一代了。本次實(shí)測(cè)可以看到，在同時(shí)開啟DLSS和光線追蹤功能之后，RTX 3080已經(jīng)足以支持4K60幀的游戲體驗(yàn)了。

我們?cè)?jīng)猜測(cè)過光追可能是未來，但沒想到這個(gè)未來來得這么快!如果說光追導(dǎo)致幀數(shù)低是你曾經(jīng)拒絕它的原因，那么這一代，這個(gè)理由已經(jīng)不成立了。

當(dāng)然，這也還得老黃去大力把這技術(shù)普及到更多的游戲制作公司、游戲引擎上，才能有足夠豐富的游戲來讓玩家買單。不然我猜到你還能說：才那么幾款游戲支持光追，有什么用呢?

拋開光追不說，RTX 30的絕對(duì)性能、以及定價(jià)，也已經(jīng)足夠排除掉你其他的選項(xiàng)了。