在眾多玩家的期待下,NVIDIA終于發(fā)布了GeForce RTX 40 SUPER系列顯卡,上周發(fā)布的RTX 4070 SUPER就帶來了令人驚喜的性能表現(xiàn)。而今天登場的是“超級戰(zhàn)隊”的第二位成員——RTX 4070 Ti SUPER,這是第一款以Ti SUPER為后綴命名的NVIDIA顯卡。作為NVIDIA核心合作伙伴,華碩也推出了TUF-RTX4070TIS-16G-GAMING,下面就來看看這款70顯卡中的“Pro Max”的表現(xiàn)究竟夠不夠“超大杯”吧!

核心規(guī)格與顯存全面提升

在之前的首發(fā)測試中,我們已經(jīng)針對RTX 40系列的新特性進行了非常詳細的介紹,所以就不再贅述,有興趣的玩家可以直接查閱我們的文章進行了解。

從官方給出的規(guī)格來看,RTX 4070 Ti SUPER核心代號為AD103-275,實際上屬于RTX 4080核心的下放型號。芯片規(guī)格明顯比采用AD104核心的RTX 4070 Ti/4070 SUPER/4070要強不少,剛好定位在RTX 4080的AD103-300和RTX 4070 Ti的AD104-275之間。
詳細規(guī)格部分,RTX 4070 Ti SUPER擁有6組GPC、33組TPC,流處理器單元為66個,CUDA核心數(shù)量則為8448,個,整體芯片的規(guī)模大約為RTX 4080的87%。相比RTX 4070 Ti來說,RTX 4070 Ti SUPER的升級幅度是比較明顯的,GPU總體規(guī)模大約提升了10%,并且顯存位寬從192bit提升到了256bit、容量提升到了16GB,顯存帶寬高了25%,更強的顯存規(guī)格會讓RTX 4070 Ti SUPER在面對高分辨率游戲和生產(chǎn)力應(yīng)用中更占優(yōu)勢。
功率部分,官方給出的RTX 4070 Ti SUPER平均游戲功率為226W,整板功率為285W,和RTX 4070 Ti保持一致,考慮到規(guī)格提升的幅度,這個能效比也是非常出色的。同時它對電源、散熱器的要求不高,擁有很低的升級門檻。
首發(fā)價格方面,RTX 4070 Ti SUPER定價保持了和RTX 4070 Ti一樣的6499元,考慮到規(guī)格方面的提升,相當于免費升級了性能。而對使用RTX 3070 Ti的老玩家來說,RTX 4070 Ti SUPER升級幅度相當大,還有游戲“黑科技”DLSS 3的加持,同時還擁有更低的功耗,非常適合老玩家升級。
豪華軍規(guī)用料,硬派造型質(zhì)感十足

華碩TUF-RTX4070TIS-16G-GAMING顯卡沿用了新版TUF GAMING的家族式設(shè)計,外觀造型上依舊主打硬朗的軍事風格。顯卡導(dǎo)流殼采用啞光黑配色,表面的金屬拉絲紋理變?yōu)榱四ド疤幚恚浜蠜_壓和切割造型,整體觀感非常的硬朗簡潔,質(zhì)感提升明顯。顯卡側(cè)面的“TUF”RGB Logo,可以支持自家的AURA SYNC神光同步信仰燈效,能夠與其他硬件進行聯(lián)動,打造出更為炫酷的整體燈效。

顯卡搭載了3個Axial-tech軸流風扇,中央風扇與兩側(cè)輔助風扇采用正逆轉(zhuǎn)工作設(shè)計,可以減少空氣亂流,提高散熱氣流利用率。3個風扇都保留了全高阻隔環(huán),能大幅提升靜壓,使其更容易吹透鰭片。風扇也支持低負載完全停轉(zhuǎn)的技術(shù),當GPU溫度低于50℃時風扇將停轉(zhuǎn),降低顯卡低負載運行時的噪聲。

散熱方面,顯卡采用了3.25槽設(shè)計,能提供更大的散熱空間和更多的散熱鰭片,熱管穿插其中,保證顯卡散熱。顯卡導(dǎo)流殼側(cè)邊的開放式設(shè)計,配合金屬背板尾部的大面積的鏤空,能夠極大地提高散熱效率。同時顯卡的導(dǎo)流殼由金屬材質(zhì)打造而成,加上全尺寸的金屬背板,大幅提升了顯卡的結(jié)構(gòu)強度。顯卡長度為305mm,相對小巧,從裝機角度來看,能兼容更多的主流MATX尺寸的機箱。

在做工用料方面,華碩TUF-RTX4070TIS-16G-GAMING依然采用了標志性的全自動化工藝制造,消除了人工在操作過程中的不確定性,讓顯卡的品質(zhì)更出色。供電部分,顯卡采用的是8+3相供電,在GPU部分使用的是UP9512R控制芯片+SiC653A(50A)MOSFET的供電方案,顯存部分則是使用了UP9529Q+SiC653A(50A)MOSFET的供電方案。這樣的供電規(guī)格配合高品質(zhì)的105℃電容,足以為顯卡長時間高頻狀態(tài)運行,提供充足而穩(wěn)定的動力。

規(guī)格方面,華碩TUF-RTX4070TIS-16G-GAMING默認頻率為2610MHz,OC模式下的Boost頻率為2640MHz。接口部分,顯卡配備了3個DP 2.1和2個HDMI 2.1,最高可支持8K/165Hz輸出,充分滿足發(fā)燒級玩家連接未來高分高刷電競顯示器的需求。顯卡的配件中除了16Pin電源轉(zhuǎn)接線和魔術(shù)捆扎帶之外,還附贈了顯卡支架兼螺絲刀配件也沒有缺席,充分考慮到了玩家使用的便利性。
游戲性能超給力,也是高效率生產(chǎn)力利器
測試平臺
顯卡:華碩TUF-RTX4070TIS-16G-GAMING
GeForce RTX 4070 Ti OC版
GeForce RTX 4080 Founders Edition
處理器:Intel酷睿i9 14900K
主板:ROG MAXIMUS Z790 HERO
內(nèi)存:芝奇DDR5 6000 16 GB×2
硬盤:WD_BLACK SN850X 2TB
電源:ROG THOR雷神1200W Platinum II
操作系統(tǒng):Windows 11專業(yè)版
基準性能測試

在3DMark GPU的基準性能測試部分,我們先來重點對比RTX 4070 Ti SUPER和RTX 4070 Ti的成績。在FireStrike 和TimeSpy系列測試中,RTX 4070 Ti SUPER平均領(lǐng)先RTX 4070 Ti大約7%。在包含光追的SpeedWay、DXR與Port Royal測試中,平均領(lǐng)先RTX 4070 Ti大約11%,其中負載更重的DX12U項目SpeedWay,提升幅度達到了15%以上。DLSS測試部分,RTX 4070 Ti SUPER相比RTX 4070 Ti 平均提升了9%,最低也有6%左右的優(yōu)勢。
綜合基準性能測試部分的成績來看,RTX 4070 Ti SUPER相對RTX 4070 Ti的基準性能提升幅度大約為9%。如果對比上代的RTX 3070 Ti的話,平均提升幅度高達90%以上,特別是光追性能的部分,平均提升達到了86%以上,接近翻倍。而相較更高一級的RTX 4080,其性能接近RTX 4080的86%左右,符合兩者芯片規(guī)模之間的差距。
游戲性能測試

接下來我們進入實際的游戲測試,先來看看純光柵游戲的表現(xiàn)。在2K分辨率下,RTX 4070 Ti SUPER平均幀率相對RTX 4070 Ti提升了4%左右,可以達到RTX 4070 Ti 87%的性能。隨著分辨率來到4K,相比RTX 4070 Ti的領(lǐng)先優(yōu)勢來到了6%左右,達到RTX 4080 85%的性能,與3DMark基準測試的情況比較符合。
從幀率上看,RTX 4070 Ti SUPER可以在2K最高畫質(zhì)下,實現(xiàn)平均132fps以上的電競級幀率,最低幀率也可以保持在85fps以上。而在4K分辨率最高畫質(zhì)下,可以讓大部分游戲大作保持60fps以上的流暢幀率,平均游戲幀率達到76fps以上。少部分平均幀率在60fps以下的游戲,比如《賽博朋克2077》《心靈殺手2》等,就算換了RTX 4080同樣不能保證穩(wěn)定60fps,沒有和RTX 4070 Ti SUPER拉開太大差距。

接下來看看光追游戲和DLSS 2測試的情況。在2K分辨率下,RTX 4070 Ti SUPER平均領(lǐng)先RTX 4070 Ti 大約3%,最高領(lǐng)先7%左右。而在4K分辨率下,RTX 4070 Ti SUPER的優(yōu)勢得到了一定的擴大,平均領(lǐng)先RTX 4070 Ti 5%左右,最高領(lǐng)先大約12%。對比RTX 4080,RTX 4070 Ti SUPER在2K分辨率下可以達到它90%的性能,4K分辨率下可以達到它87%左右的性能,這個表現(xiàn)還是很不錯的。

作為RTX 40獨占的“黑科技”,DLSS 3能給游戲帶來巨大的幀率加成,目前也有很多游戲大作都添加了對DLSS 3的支持。從測試的幾款支持DLSS 3/DLSS 3.5的游戲來看,RTX 4070 Ti SUPER在開啟DLSS 3之后,游戲的幀率都得到了巨幅提升。有三款游戲的DLSS 3幀率都是原生幀率的2倍以上,其中《賽博朋克2077》《心靈殺手2》從不到60fps的幀率直接來到120fps以上的流暢高幀,其他游戲中也有32%~84%的提升,平均提升幅度達到93%。


DLSS 3不僅能帶來幀率上的巨幅提升,最新的DLSS 3.5支持的光線重建技術(shù)還可以進一步增加游戲畫面的細節(jié)。可以看到,在《心靈殺手2》中開啟光線重構(gòu)功能之后,水面反光的倒影細節(jié)變得更加豐富,清晰度也上升了一個等級。此外,DLSS 3還可以降低幀延遲和操作延遲,提升玩家操控的響應(yīng)速度。從測試來看,開啟DLSS 3后,游戲的延遲都大幅下降,流暢度明顯增加,提升效果明顯。
視頻/圖片編輯與3D渲染

RTX 4070 Ti SUPER具備16GB大顯存以及256bit的顯存位寬,還有NVIDIA STUDIO加持,因此它在生產(chǎn)力方面也會有更好的表現(xiàn)。從測試來看,在Blender、V-Ray和Octane的3D渲染輸出項目中,相對RTX 4070的領(lǐng)先幅度大約為7%~15%,PugetBench for Premiere Pro 2024中平均領(lǐng)先4%左右。SPECView測試中,領(lǐng)先RTX 4070 Ti的幅度最高可達10%。總的來看,在3D渲染性能方面,RTX 4070 Ti SUPER領(lǐng)先RTX 4070 Ti 6%以上,可以達到RTX 4080 89%以上的性能。

RTX 4070 Ti SUPER的3D渲染性能對比上代的RTX 3070 Ti的話,提升就相當大了。在Blender、V-Ray和Octane的3D渲染輸出項目中,平均領(lǐng)先RTX 3070 Ti 大約77%,最高提升達到了88%左右,提升巨大。

視頻轉(zhuǎn)碼部分,RTX 4070 Ti SUPER不僅核心規(guī)格得到了提升,還擁有更多的編碼器,同時加入了AV1編碼的支持。在達芬奇Prores422HQ視頻編碼測試中,RTX 4070 Ti SUPER相對RTX 3070 Ti的H.264編碼速度提升了136%,H.264編碼速度提升了151%。至于AV1硬件編碼,RTX 3070 Ti硬件上就無法支持。因此對于有3D設(shè)計、視頻/圖片編輯的專業(yè)用戶來講,RTX 4070 Ti SUPER是一款高效率的生產(chǎn)力工具。
AIGC性能測試
眼下AIGC應(yīng)用人氣爆棚,而其中的Stable Diffusion本地AI出圖更是全民級AI應(yīng)用。RTX 4070 Ti SUPER擁有16GB大容量顯存,算力也相當出色,確實非常適合用來完成Stable Diffusion本地出圖任務(wù)。這里我們選用Stable Diffusion Automatic1111 WebUI來對RTX 4070 Ti SUPER的出圖效率進行測試。

首先是Stable Diffusion的基準測試,我們使用了NVIDIA官方推薦的標準設(shè)置:采樣方式為Euler a、采樣步數(shù)為50、CFG Scale為7.5、每批次出圖數(shù)為2、批次為10,最后統(tǒng)計每分鐘出圖數(shù)量。從表中可以看到,RTX 4070 Ti SUPER每分鐘出圖數(shù)量達到12.36張,比RTX 4070 Ti快了約15%,效率是RTX 3070 Ti的1.78倍。要是和Core i9 13900K相比的話,RTX 4070 Ti SUPER出圖效率可以達到它的158倍。

▲在Stable Diffusion中使用NVIDIA TensorRT優(yōu)化的Unet以大幅提升RTX 40 GPU的出圖效率
除此之外,NVIDIA GPU一直以來對Stable Diffusion的支持都非常到位,不但兼容性完美,還可以提供當下遙遙領(lǐng)先的計算性能。NVIDIA推出的NVIDIA TensorRT,可以讓NVIDIA GPU更高效地運行已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)。接下來我們就使用NVIDIA TensorRT分別對Stable Diffusion XL和Stable Diffusion V1.5的模型進行了優(yōu)化,由此來對比優(yōu)化前后RTX 4070 Ti SUPER出圖效率的變化。
在使用Stable Diffusion V1.5的模型時,我們分別選用了512×512、768×768的出圖分辨率,而在使用Stable Diffusion XL模型時選用了1024×1024的出圖分辨率(與訓(xùn)練模型的圖片分辨率相同)。其他參數(shù)方面,采樣方式為Euler a、采樣步數(shù)為50、CFG Scale為7、每批次出圖數(shù)為1、批次為10。

可以看到,在使用NVIDIA TensorRT優(yōu)化后,RTX 4070 Ti SUPER在Stable Diffusion V1.5的512×512出圖分辨率測試中提升幅度達到了100%,768×768出圖分辨率測試中提升幅度達到147%。Stable Diffusion XL出圖測試中,提升幅度也高達105%,可見NVIDIA TensorRT的優(yōu)化效果相當出色,非常值得使用。
從Stable Diffusion測試可以看到,RTX 4070 Ti SUPER可以提供相當不錯的AI計算性能,依靠16GB大顯存也可以輕松完成Stable Diffusion XL的1024×1024高分辨率出圖,并且還可以通過NVIDIA TensorRT進一步提升出圖效率。
功耗溫度與超頻測試

能效比同樣是RTX 4070 Ti SUPER的亮點,具體到這款華碩TUF-RTX4070TIS-16G-GAMING,我們用FrameView工具在游戲中記錄并計算出平均功率。從結(jié)果來看,華碩TUF-RTX4070TIS-16G-GAMING的游戲平均功率只有236W左右,能效比表現(xiàn)十分出色。

溫度方面,從FurMark考機情況來看,得益于強悍的3風扇散熱系統(tǒng),華碩TUF-RTX4070TIS-16G-GAMING的核心溫度為61.7℃,熱點溫度73.9℃,整卡功率最高達到了285.3W。同時在默認設(shè)置下進行考機,顯卡的風扇轉(zhuǎn)速只有1384rpm左右,風噪聲很小,散熱表現(xiàn)非常優(yōu)秀。

此外,我們也對其進行了簡單的超頻。華碩TUF-RTX4070TIS-16G-GAMING的功耗墻可以拉到110%,最終我們將顯卡的GPU頻率提升了250MHz,成功突破3GHz,顯存頻率則提升了200MHz,在TimeSpy GPU測試中分數(shù)達到了26204,表現(xiàn)相當不錯。技術(shù)力強的玩家,還可以進行參數(shù)微調(diào),進一步挖掘華碩TUF-RTX4070TIS-16G-GAMING的性能潛力。
總結(jié):信仰級游戲利器,性能出色還能超頻
作為RTX 40 SUPER系列第二個登場的成員,RTX 4070 Ti SUPER依舊沒有讓我們失望,憑借其RTX 4080的血統(tǒng),帶來了“超大杯”性能表現(xiàn)。從游戲性能方面來看,RTX 4070 Ti SUPER在4K分辨率下的游戲性能相對RTX 4070 Ti提升了5%以上,綜合性能達到RTX 4080的87%以上。在2K分辨率下,RTX 4070 Ti SUPER完全可以實現(xiàn)最高畫質(zhì)下100fps以上的電競幀率,而有了DLSS的加持,4K分辨率下也能夠在大部分3A游戲中達到流暢幀率。
在專業(yè)性能方面,RTX 4070 Ti SUPER具備更大的16GB顯存和256bit的顯存位寬,配合更高的核心規(guī)格。使得RTX 4070 Ti SUPER在3D渲染輸出與視頻剪輯方面相對RTX 3070 Ti也有巨幅的性能提升,AI出圖方面則實現(xiàn)了翻倍的性能表現(xiàn),還有NVIDIA TensorRT帶來的性能優(yōu)化,所以RTX 4070 Ti SUPER可以稱得上是高效率的生產(chǎn)工具。
在超公版RTX 4070 Ti SUPER中,華碩TUF-RTX4070TIS-16G-GAMING擁有性化造型設(shè)計和軍工級別的出色用料、做工,在性能和散熱上的表現(xiàn)相當優(yōu)秀,并且顯卡還擁有不俗的超頻潛力,可以輕松超頻至3GHz。對于追求極致游戲體驗的發(fā)燒玩家和追求效率的設(shè)計師用戶來說,華碩TUF-RTX4070TIS-16G-GAMING是個理想的選擇。