CPU處理器那邊迎來(lái)了近十年最熱鬧的場(chǎng)面,一直飛速發(fā)展的GPU顯卡也不甘寂寞,AMD全新的高性能大核心Vega終于快出來(lái)了。
而就在這個(gè)時(shí)候,NVIDIA放出了終極殺招——真正核彈級(jí)別的旗艦GeForce GTX 1080 Ti隆重登場(chǎng)!“鈦”字金招牌再現(xiàn)江湖!
NVIDIA這一代“帕斯卡”(Pascal)家族無(wú)論各方面表現(xiàn)都十分優(yōu)秀,性能突出,能耗更低,產(chǎn)品普及也非常快,已經(jīng)幾乎完全鋪滿了桌面、筆記本、高性能計(jì)算、圖形工作站等各個(gè)領(lǐng)域,延續(xù)了強(qiáng)勢(shì)表現(xiàn)。
在桌面上,此前的旗艦可以說(shuō)是Titan X,擁有無(wú)比豪華的規(guī)格,但一方面它主要是針對(duì)高性能計(jì)算而生的,強(qiáng)調(diào)浮點(diǎn)精度計(jì)算,而且價(jià)格高達(dá)9499元,還不開(kāi)放非公版,第三方廠商基本沒(méi)有,所以市面上幾乎買(mǎi)不到。
GTX 1080 Ti就不一樣了,它是真正的游戲旗艦卡,規(guī)格彪悍,黃仁勛在發(fā)布時(shí)就直言,其性能已然超越Titan X,著實(shí)瘋狂!
它的價(jià)格“只要”5699元,更關(guān)鍵的是產(chǎn)品豐富,各家的非公版都已經(jīng)第一時(shí)間迫不及待地露面,未來(lái)價(jià)格空間也更有彈性。
對(duì)于那些追求極致的游戲玩家而言,這才是上上之選。
【它是怎么超越Titan X的?】
GTX 1080 Ti采用了和Titan X相同的GP102大核心,同樣有3584個(gè)流處理器,分為28組SM(流處理器陣列),相比于GTX 980 Ti 2816個(gè)猛增了27%。
但即便是這樣的旗艦卡,NVIDIA依然沒(méi)有給它真正開(kāi)足馬力——GP102核心其實(shí)擁有30組SM、3840個(gè)流處理器,這里還是隱藏了兩組256個(gè),只有在GP100那樣的專業(yè)卡上,才能看到滿血的GP102。
而按照目前的產(chǎn)品布局和市場(chǎng)形勢(shì),桌面玩家恐怕是不可能再得到完整的GP102核心了。
帕斯卡架構(gòu)專為高頻率做了優(yōu)化,GTX 1080 Ti也絲毫不弱,核心基礎(chǔ)頻率1480MHz、加速頻率1582MHz(甚至有能力超過(guò)2GHz),不僅比GTX 980 Ti提高了幾乎50%,也略高于Titan X 1471-1531MHz。
它還有224個(gè)紋理單元,加速頻率下紋理填充率高達(dá)354.4GT/s,比上代猛增超過(guò)85%。
顯存方面,NVIDIA獨(dú)家擁有GDDR5X,GTX 1080 Ti更是搭配了新一代芯片,等效頻率高達(dá)恐怖的11GHz,創(chuàng)造了一個(gè)歷史記錄。
為了獲得這么高的速度,NVIDIA與供應(yīng)商緊密合作,使用高級(jí)均等化技術(shù)降低物理界面的不利影響,抖動(dòng)和電噪音也壓到了最低,使得信號(hào)傳輸更加純凈。
這幅對(duì)比圖中,左側(cè)是原有的GDDR5X跑在11GHz,可以看到信號(hào)圖中央部位有大量雜亂信號(hào),顯然會(huì)干擾數(shù)據(jù)傳呼,而右側(cè)的新一代GDDR5X 11GHz就好多了。
GTX 1080 Ti的顯存位寬為352位——一個(gè)奇怪的數(shù)字,相比于Titan X砍掉了32位——結(jié)合11GHz高頻率可以帶來(lái)484GB/s的有效帶寬,直逼HBM。
另外,帕斯卡架構(gòu)還可以將原始顯存帶寬進(jìn)一步擴(kuò)大,獲得更多有效帶寬,比如大家都熟悉的顯存壓縮。
比如新的“Tiled Caching”(暫譯區(qū)塊緩存)。
GPU架構(gòu)目前有兩種主流渲染方式,一是高端桌面GPU常用的立即渲染模式(Immediate Renderng),二就是移動(dòng)GPU喜歡的區(qū)塊渲染/平鋪式渲染(Tiled Rendering)。
立即渲染模式下,輸入的每一條指令都會(huì)順序執(zhí)行,比如要繪制一個(gè)三角形,那就把它畫(huà)完再進(jìn)行下一步工作。
這樣做的好處是只需一次性讀取輸入幾何數(shù)據(jù),輸入內(nèi)容更靈活而不會(huì)耗盡資源,但缺點(diǎn)是在高度重疊的區(qū)域(比如分層的云彩),同樣的像素往往會(huì)多次讀寫(xiě),浪費(fèi)顯存帶寬。
區(qū)塊渲染,顧名思義就是將畫(huà)面分割成多個(gè)單獨(dú)的區(qū)塊,分兩步渲染。首先,根據(jù)幾何數(shù)據(jù)決定每個(gè)三角形覆蓋的區(qū)塊,將此信息寫(xiě)入顯存;然后,每個(gè)區(qū)塊單獨(dú)進(jìn)行幾何處理,每渲染完一個(gè)區(qū)塊,再進(jìn)行下一個(gè),整個(gè)過(guò)程都在GPU上機(jī)型,只有最終色彩才會(huì)寫(xiě)入顯存。
這種渲染方式有兩大局限,一是會(huì)增加驅(qū)動(dòng)延遲和復(fù)雜性, 其二也是更關(guān)鍵的,對(duì)顯存帶寬的控制要求極高,所以傳統(tǒng)上只有移動(dòng)GPU才用它,比如Imagination PowerVR、ARM Mali。
NVIDIA在上代麥克斯韋架構(gòu)中就加入了區(qū)塊渲染技術(shù),帕斯卡架構(gòu)中進(jìn)一步強(qiáng)化,但直到現(xiàn)在才公開(kāi)部分細(xì)節(jié)。
簡(jiǎn)單地說(shuō),NVIDIA使用了一種新的混合渲染方式,仍以立即渲染為主,但在渲染流水線中加入了一個(gè)“binner”,負(fù)責(zé)向二級(jí)緩存(2816KB)寫(xiě)入片上幾何隊(duì)列,數(shù)據(jù)量滿足特定緩存大小后就會(huì)進(jìn)行渲染,逐個(gè)區(qū)塊進(jìn)行,直到隊(duì)列處理完畢。
這就是所謂的Tiled Caching,利用區(qū)塊光柵化改進(jìn)二級(jí)緩存的有效性,相比傳統(tǒng)區(qū)塊渲染架構(gòu),可以節(jié)省類似的像素帶寬,但不會(huì)損害幾何帶寬或者增加延遲。
再加上新的無(wú)損4:1、8:1 Delta顏色壓縮模式,包括GTX 1080 Ti在內(nèi)的帕斯卡家族成員可以大大減少需要從現(xiàn)存中提取送給GPU的數(shù)據(jù)量。
按照NVIDIA的說(shuō)法,以上各種技術(shù)結(jié)合起來(lái),GTX 1080 Ti能將有效顯存帶寬翻一番還多,幾乎有1.2GB/s。
顯存容量方面,NVIDIA選擇了11GB,正好配合352位的位寬,每32位對(duì)應(yīng)一顆1GB顆粒。
這也是一個(gè)新高度,NVIDIA號(hào)稱可以輕松滿足的當(dāng)今游戲大作在5K分辨率下的要求。
NVIDIA表示,GTX 1080 Ti相比于GTX 1080的平均游戲性能提升幅度高達(dá)35%,是近幾年類似產(chǎn)品之間最大的進(jìn)步。
新聞熱點(diǎn)
疑難解答
圖片精選