看過我們之前十年旗艦N卡橫評(píng)(點(diǎn)擊這里可以跳轉(zhuǎn))的朋友,可能都會(huì)感慨半導(dǎo)體行業(yè)的神速發(fā)展,從GTX 480到RTX 2080 Ti,性能提升到了1298%!
看過我們之前十年旗艦N卡橫評(píng)(點(diǎn)擊這里可以跳轉(zhuǎn))的朋友,可能都會(huì)感慨半導(dǎo)體行業(yè)的神速發(fā)展,從GTX 480到RTX 2080 Ti,性能提升到了1298%!
也有朋友吐槽RTX 20對(duì)比GTX 10提升不大,但是,在老黃發(fā)布RTX 30后,那價(jià)格,那性能,真香!
同時(shí)這也引發(fā)了圈內(nèi)一大波的連鎖效應(yīng),RTX 2080 Ti二手價(jià)格一夜腰斬,相關(guān)的段子和弔圖也鋪得滿天都是,不過關(guān)于RTX 3080的評(píng)測(cè)相信大家已經(jīng)看過不少,今天我們就帶來更為直觀的RTX 3080評(píng)測(cè)視頻。
視頻不僅有3080的全面測(cè)試,還有對(duì)比十年前GTX480等特別的項(xiàng)目,大家耐心看就知道啦。
當(dāng)然了假如你不喜歡看視頻,或者流量捉雞,我們也有文字版本~
NVIDIAAmpere架構(gòu)解析-CUDA流處理器翻倍提升的秘密
有的朋友可能想到了,那么晶體管翻倍是不是就是流處理器翻倍的原因呢?你答對(duì)了一點(diǎn)點(diǎn),晶體管暴增讓GA102核心擁有84組SM計(jì)算單元,比上一代的TU102多了12組,但我們這次評(píng)測(cè)的3080和2080 Ti SM單元一樣僅有72組,但CUDA核心數(shù)目還是翻倍了
根本原因是這次老黃改變了N卡流處理器的運(yùn)算模式。
想搞清楚這點(diǎn)我們首先要知道顯卡運(yùn)算一般分為整數(shù)運(yùn)算(Integer)和浮點(diǎn)運(yùn)算(floatingpoint)兩種,而浮點(diǎn)運(yùn)算可以分為半精度(FP16)、單精度(FP32)、雙精度(FP64),整數(shù)運(yùn)算也可以這樣劃分。
與游戲最密切相關(guān)的就是FP32運(yùn)算,其次是INT32,從費(fèi)米架構(gòu)以來NV就把顯卡專門做FP32的運(yùn)算單元叫做CUDA核心,因此以往我們可以根據(jù)CUDA核心的數(shù)量來比較N卡性能,但是做其他運(yùn)算的流處理器數(shù)量NV并沒有統(tǒng)計(jì)
那么總流處理器數(shù)怎么算的呢?
以2080 Ti TU102核心圖為例,完整的TU102有6組GPC圖形簇,每組GPC有12組SM單元。
再放大一點(diǎn)這里我們能看到每組SM又能劃分為四個(gè)小組,每個(gè)小方格代表一個(gè)運(yùn)算單元,因此一個(gè)模塊有16個(gè)進(jìn)行FP32運(yùn)算的cuda單元,和16個(gè)進(jìn)行INT32運(yùn)算的單元,還有個(gè)Tensor Croes,一個(gè)SM總共64個(gè)CUDA運(yùn)算單元和64個(gè)INT32運(yùn)算單元,4個(gè)tensorCores和1個(gè)RTCores,這是圖靈架構(gòu)的細(xì)節(jié),所以TU102總共有64*12*6共4608個(gè)cuda核心和4608個(gè)INT32運(yùn)算單元。
到了NVIDIAAmpere架構(gòu),大家能發(fā)現(xiàn)這里原本的16個(gè)INT32單元也能進(jìn)行FP32運(yùn)算,右邊的FP32單元保持不變,所以這樣一個(gè)小分區(qū)里一個(gè)運(yùn)算周期內(nèi)顯卡可以選擇做16個(gè)FP32運(yùn)算+16個(gè)INT32運(yùn)算或者做16FP32+16FP32共32個(gè)FP32運(yùn)算。
因此按照N卡能做FP32運(yùn)算的單元就是CUDA核心的算法,這里一個(gè)SM單元的CUDA流處理器數(shù)目就翻倍到128個(gè)了。
這樣做能讓顯卡在單純跑FP32浮點(diǎn)運(yùn)算時(shí)性能翻倍,但是顯卡在游戲中是不可能只做浮點(diǎn)運(yùn)算的,這也是為什么3080對(duì)比2080 Ti CUDA數(shù)目翻倍,但游戲性能并不會(huì)翻倍的原因。
除了CUDA核心數(shù)目提升,顯存帶寬提升也是RTX30性能暴漲的一大原因,3080和3090采用了鎂光新一代的GDDR6X顯存,新顯存加入PAM4信令機(jī)制,讓每周期傳輸?shù)臄?shù)據(jù)量翻倍,大家可以理解為SLC到MLC那樣的升級(jí)。
新的顯存其速率達(dá)到了19Gbps和19.5Gbps,根據(jù)顯存帶寬等于顯存速率 x 位寬除以8,3080的顯存帶寬達(dá)到了760GB/s,3090更是達(dá)到了驚人的936GB/s,對(duì)比2080 Ti提升了24%和52%。
其他方面呢,比如PCIE4.0與RTXIO、HDMI2.1這些就不詳細(xì)介紹了。
但是這次公版設(shè)計(jì),還是獲得我們的一致好評(píng), 不得不佩服NVIDIA的工業(yè)設(shè)計(jì)能力,看到官方渲染圖的時(shí)候,我們都嘖嘖稱奇,有人說沒必要,也有人說這是藝術(shù)品。
直到我們看到它滿載78℃與裸機(jī)48分貝噪音的測(cè)試結(jié)果的時(shí)候,整個(gè)猛男團(tuán)隊(duì)都跪服了,這個(gè)異形PCB實(shí)在是太有必要了。也只有這樣的設(shè)計(jì),才能用上這種雙軸流通式散熱器。
第二部分,為什么這次它叫RTX 3090,而不是RTX3080 Ti?
這部分單純是我們的猜測(cè),如有雷同實(shí)屬巧合,以后發(fā)現(xiàn)猜錯(cuò)了再回來打我們臉吧
猜測(cè)1:雖然AMD遲遲沒有出招,皮衣刀客老黃的實(shí)力可不是蓋的,這次算了算差不多是AMD再怎么蓄力都觸碰不了的高度,出了張新卡,直接給它命名90吧,既能給AMD一個(gè)震懾作用,又能把價(jià)格定得更高,畢竟是90嘛,怎么也得比80Ti賣貴一些呀,好了,大家乖乖掏錢。
猜測(cè)2:在頂級(jí)位置安排一個(gè)高定價(jià)的RTX3090,能顯得RTX3080性價(jià)比很高,畢竟看規(guī)格有80%的性能,可價(jià)格還不到一半,是不是很香?預(yù)計(jì)第一批貨會(huì)秒沒。
猜測(cè)3:在RTX3090和3080之間還有很多刀的空間,比如RTX3080可以加點(diǎn)流處理器,加點(diǎn)顯存,做成RTX3080Ti或者3080S作為后手招呼AMD10月28日要發(fā)的大Navi,畢竟這5499和11999之間還有6000多塊錢的差價(jià)。
而且從老黃在發(fā)布會(huì)上的說法來看,R
對(duì)了,就算是RTX3090也不是完整版,參照我們前面的算法,完整版GA102是有10752個(gè)流處理器的,老黃只開了10496個(gè)。
反正無論如何,老黃還留了個(gè)超級(jí)后手,…真不愧是皮衣刀客,刀法如此精妙,猛男團(tuán)佩服佩服。
第三部分,十年顯卡性能增長(zhǎng)多少?
3090還沒解禁,目前3080也算是這十年來NVIDIA游戲顯卡市場(chǎng)中最強(qiáng)的單芯卡了,立馬實(shí)測(cè)一波
測(cè)試平臺(tái)和項(xiàng)目與上期一致,大家看表格就好。
評(píng)測(cè)平臺(tái)操作系統(tǒng)Windows 10 1909 Pro Workstations 18363.720CPUi7-10700K主板華碩ROG M12E內(nèi)存影馳HOF EXTREME 設(shè)置在3600MHz8GB X 2SSD三星 970 Evo Plus 1TB電源昆侖KL-1080W電源水冷散熱器超頻三凌鏡GI-CX360水冷散熱器
理論性能測(cè)試方面RTX3080平均四項(xiàng)對(duì)比2080Ti提升了28%,對(duì)比2080提升了65%。
在游戲方面,麻煩又來了,因?yàn)?080性能實(shí)在太強(qiáng),即使我們開了全高畫質(zhì),很多游戲比如吃雞在1080P下CPU還是出現(xiàn)瓶頸了,3080對(duì)比2080Ti的提升只有幾幀。
很多小機(jī)靈鬼在上期視頻曾經(jīng)質(zhì)疑我們,怎么不用10900K呢?其實(shí)看過我們十代酷睿評(píng)測(cè)這期的網(wǎng)友就知道和10700K差不多性能的9900K游戲?qū)Ρ?0900K也就弱了7%,不能根本性解決問題該瓶頸還是瓶頸。
這也側(cè)面說明了,目前CPU的游戲性能增長(zhǎng)已經(jīng)趕不上GPU游戲性能的增長(zhǎng)了,大家手動(dòng)艾特牙膏廠進(jìn)來挨打!
最后剔除掉有問題的數(shù)據(jù),最終3080對(duì)比2080 Ti提升22%,對(duì)比480提升到了1584%,整機(jī)平臺(tái)功耗上漲了133W。
但是顯然用這種測(cè)試方法來給RTX 3080對(duì)比RTX 2080 Ti的提升下結(jié)論,是不夠全面的,主要有三個(gè)槽點(diǎn)。
RTX30系顯卡是支持PCIe 4.0的顯卡,你這里用PCIe 3.0的平臺(tái)會(huì)不會(huì)限制顯卡性能發(fā)揮?
剛剛也說了1080P下很多游戲中CPU已經(jīng)成為瓶頸,而且買這個(gè)性能顯卡的玩家大部分也不會(huì)在1080P下玩游戲了,對(duì)比2K游戲和4K游戲性能會(huì)更為靠譜。
第三,我們這里為了讓10年前的顯卡都能和3080在同一條賽道上比賽,用的都是老游戲,但是DX12新游戲,特別是包含光線追蹤和DLSS支持的新游戲才是兩者差距所在,才能體現(xiàn)30系第二代RT Cores和TensorCores的威力。所以我們?cè)賮韨€(gè)加時(shí)賽,專門讓3080、2080Ti、2080SUPER和2080和進(jìn)行PK。
第四部分:PCIe4.0顯卡用在3.0平臺(tái)有沒瓶頸?
其實(shí)在老黃開發(fā)布會(huì)官方演示的PPT中,他們就是使用酷睿i9進(jìn)行測(cè)試的,光是這點(diǎn),你們就不用擔(dān)心PCIe3.0夠不夠用的問題了。但猛男抱著實(shí)事求是的態(tài)度,還是拿支持PCIe4.0的AMDRyzen93900XT與X570作為平臺(tái)再測(cè)一遍對(duì)比一下。
雖然兩者跑3DMark的帶寬測(cè)試有差距,但是多個(gè)理論性能測(cè)試項(xiàng)目中,兩者都沒有明顯的差異,因此我們可以得到結(jié)論P(yáng)CIe3.0×16的帶寬是完全能滿足RTX3080對(duì)帶寬的需求的。
但是,我這個(gè)結(jié)論只針對(duì)單卡用途啊,因?yàn)镽TX3080是不支持雙路SLI的,而RTX3090則是支持SLI的,如果在Z490這種消費(fèi)平臺(tái)PCIe3.0主板上進(jìn)行雙路SLI的話,那每路就只能拿到PCIe3.0×8的通道了,在那個(gè)時(shí)候就可能出現(xiàn)瓶頸了。
第五部分,加入DX12游戲,更全面的性能測(cè)試
針對(duì)第二點(diǎn)我們先追加了三項(xiàng)理論性能測(cè)試,分別是更嚴(yán)苛的DX12測(cè)試場(chǎng)景TimeSpyExtreme、光追性能測(cè)試PortRoyal和DLSS測(cè)試,這里3080對(duì)比2080Ti也是保持30%左右的性能優(yōu)勢(shì)。
除此以外我們還準(zhǔn)備了6個(gè)新游戲進(jìn)行測(cè)試其中有5個(gè)支持光線追蹤和DLSS,這里只看它們?cè)?K和4K分辨率下的表現(xiàn),各項(xiàng)測(cè)試中3080對(duì)比2080Ti都有明顯的優(yōu)勢(shì)。
在毀滅戰(zhàn)士4k分辨率測(cè)試時(shí)優(yōu)勢(shì)最明顯,達(dá)到43%,平均下來也有30%左右的提升,而對(duì)比2080提升最大則在德軍總部4k分辨率測(cè)試中,這里顯然2080和2080SUPER就爆顯存了,幀數(shù)只有30801/3。
結(jié)合此前6個(gè)舊游戲中這四張顯卡在2K、4K分辨率的成績(jī),最后我們就能得到這張全面的性能百分比圖表。
12個(gè)游戲,兩個(gè)分辨率,9項(xiàng)理論性能測(cè)試,這33項(xiàng)測(cè)試得出的這張性能百分比圖表應(yīng)該算非常全面和具有參考價(jià)值的了,RTX3080對(duì)比RTX2080Ti提升為28%,對(duì)比2080SUPER提升56%,對(duì)比2080提升足足有71%。
第六部分,對(duì)比目前最強(qiáng)A卡,簡(jiǎn)直是屠殺..
雖然現(xiàn)在市面上的A卡比較弱雞,但作為NV目前唯一的對(duì)手,這里我還是要象征性拿出幾張A卡出來鞭尸,這里我們選用了RadeonVII和5700XT兩張顯卡,因?yàn)槲覀儼l(fā)現(xiàn)雖然理論性能RadeonVII是目前最強(qiáng)的A卡,但是GCN架構(gòu)實(shí)在太老了,在很多新游戲中RadeonVII的表現(xiàn)反而不如5700XT,因此我們索性兩張顯卡都加入測(cè)試。
測(cè)試項(xiàng)目是12項(xiàng)游戲中不涉及光追和DLSS的7個(gè)游戲,最終3080比RadeonVII強(qiáng)了82%,對(duì)比RX5700XT強(qiáng)了93%,接近翻倍
測(cè)試結(jié)果看完,相信每一個(gè)A粉都?jí)毫ι酱螅贿^蘇媽給了大家點(diǎn)信心,根據(jù)泄露的消息,BIGNAVI采用RDNA2架構(gòu),命名6800或者6900XT,10月28日發(fā)布,屆時(shí)我們?cè)賮砜纯醇t綠兩家的PK。
第7部分,功耗溫度測(cè)試、噪音測(cè)試、延遲測(cè)試
RTX30系使用的是三星特制8nm工藝,顯卡的功耗表現(xiàn)如何呢?這里我們使用了一套很牛逼的設(shè)備,由NVIDIA提供能通過PCIe插槽供電和外接供電直接讀出顯卡單獨(dú)的功耗,3080的功耗比2080Ti要高了30~60W,能耗比對(duì)比2080Ti高了7%。
這樣看新顯卡的工藝還是有點(diǎn)拉跨,其實(shí)三星8nm工藝確實(shí)在密度上是比不上臺(tái)積電的7nm工藝的,老黃用它也是勝在便宜,最后3080的價(jià)格也確實(shí)讓人驚喜。
顯卡的噪音也非常不錯(cuò),50分貝以下根本沒有感覺。
在RTX30系發(fā)布會(huì)上老黃還提到了一個(gè)降低顯卡延遲的技術(shù)Reflex這里我們也檢測(cè)了一下新顯卡在堡壘之夜游戲中的延遲情況,打開Reflex后在畫面延遲確實(shí)有所降低,而且分辨率越高療效越明顯,對(duì)職業(yè)電競(jìng)玩家的確實(shí)是個(gè)好東西,只是對(duì)于曉邊我來說可能就感知不強(qiáng)了。
總結(jié)
3080的性能提升足夠讓人驚喜,當(dāng)然最令我驚訝的是價(jià)格,畢竟此前的消息一直都說RTX30系要繼續(xù)漲價(jià),唯一的槽點(diǎn)就是功耗也增長(zhǎng)了不少,但前面也說了,假如不是用三星8nm工藝,新顯卡的價(jià)格也不會(huì)那么出人意料,算是一把雙刃劍吧,大家記得選購(gòu)靠譜的電源就好。
再?gòu)氖晏嵘那€也能看出,在RTX20劃了兩年水之后,在心疼買了20系的小伙伴之余,也能欣慰地看到這代RTX 30系的提升開始回到了正軌,而對(duì)于RTX 3090顯卡,性能從它的規(guī)格來看也大致推算出會(huì)比3080強(qiáng)20%左右,八九不離十了。
如果說英偉達(dá)圖靈架構(gòu)的RTX20是試水光追的一代,那么英偉達(dá)安培架構(gòu)的RTX30就是揚(yáng)帆起航的一代了。本次實(shí)測(cè)可以看到,在同時(shí)開啟DLSS和光線追蹤功能之后,RTX 3080已經(jīng)足以支持4K60幀的游戲體驗(yàn)了。
我們?cè)?jīng)猜測(cè)過光追可能是未來,但沒想到這個(gè)未來來得這么快!如果說光追導(dǎo)致幀數(shù)低是你曾經(jīng)拒絕它的原因,那么這一代,這個(gè)理由已經(jīng)不成立了。
當(dāng)然,這也還得老黃去大力把這技術(shù)普及到更多的游戲制作公司、游戲引擎上,才能有足夠豐富的游戲來讓玩家買單。不然我猜到你還能說:才那么幾款游戲支持光追,有什么用呢?
拋開光追不說,RTX 30的絕對(duì)性能、以及定價(jià),也已經(jīng)足夠排除掉你其他的選項(xiàng)了。
關(guān)鍵詞: