基于Ada Lovelace架構的RTX 40系列GPU,具備第三代RT Cores和第四代Tensor Cores,為發燒級游戲玩家、設計師用戶與AI行業提供了當下最佳的高效解決方案。目前,RTX 40家族已經登場的有RTX 4090、RTX 4080和RTX 4070 Ti,而現在我們終于迎來了RTX 4070,官方給它的定位是“2K光追游戲100fps以上體驗”。而眾多非公版本卡廠商也同期推出了自己精心打造的RTX 4070產品,本次測試我們使用了七彩虹iGame GeForce RTX 4070 Advanced OC,一起來看看它的表現如何吧。

RTX 40系列GPU關鍵特性回顧
在之前的首發測試中,我們已經針對RTX 40系列的新特性進行了非常詳細的介紹,所以就不再贅述,有興趣的玩家可以直接查閱我們的文章進行了解。這里只列出其中的關鍵點和新增的部分供大家參考。
(Ada Lovelace架構解析:https://mp.weixin.qq.com/s/GVBG6oVSIOVeb8B9F0wzWg)

• 采用NVIDIA定制4N工藝的NVIDIA Ada Lovelace架構。

• 全新設計的SM多單元流處理器,可提供高達2倍的性能與能效比。
• 配備第4代Tensor Cores 和光流加速器,大幅提升了AI計算能力,為當下火熱的AI應用提供了革命性的動力,同時也帶來了支持幀生成、可大幅提升幀率的NVIDIA DLSS 3技術。
• 配備第3代 RT Cores,提供高達2倍的光追性能,讓光追游戲的體驗提升到了新的境界。
• 支持著色器執行重排序(SER),可將執行光追操作的著色器性能最高提升2倍,在《賽博朋克2077》光追Overdrive模式中,整體游戲性能最高可提升44%。

• DLSS 3技術:利用AI計算生成額外的高質量幀,巨幅提升游戲幀率,最高可以做到一倍以上的幀率提升。

• 新一代NVIDIA Studio:為3D渲染、視頻編輯和直播帶來極高的效率。NVIDIA Studio全套創意應用包括NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix等等。同時,NVIDIA Studio在生產力方面的生態環境是業界公認的標桿。

• AV1 Encoders:提供支持AV1的第8代NVIDIA編碼器,效率比H.264高40%,為主播、直播用戶與視頻會議應用帶來更高效、更高質量的體驗。

• 新增RTX VSR技術,可通過AI技術大幅提升視頻畫面質量。RTX VSR 支持RTX 40 或 30 系列 GPU,并且幾乎適用于Google Chrome和Microsoft Edge瀏覽器中所有視頻內容,目前VLC播放器也首發支持了RTX VSR。目前包括B站、愛奇藝等流媒體網站已經支持VSR,我們下文的VSR效果對比截圖即來自于此。
NVIDIA DLSS 3普及速度驚人

我們知道,NVIDIA DLSS 3技術是RTX 40系列GPU的獨門絕技,也是玩家升級到RTX 40系列的核心價值之一。它包括 3大功能“幀生成技術”、“超分辨率(DLSS 2 的核心)”和“NVIDIA Reflex”。也就是說,開發者只需在游戲或者應用中整合DLSS 3,即可默認支持 DLSS 2。

RTX系列GPU剛推出時,只有37%的RTX20系列玩家啟用光追、26%的人在游戲中啟用了DLSS。而至今為止有超過400個RTX加速的游戲、應用和數以百萬計的RTX玩家。目前,83%的RTX40系列玩家都啟用了光追、高達79%的玩家都啟用了DLSS,可見RTX技術發展勢頭驚人。

當下有超過280款DLSS游戲和應用已經發布,其中包括了30款DLSS 3游戲。從數據來看,在DLSS 2和DLSS 3各自發布的前6個月中,DLSS 3被采用的速度比DLSS 2快了7倍,可見業界對于NVIDIA DLSS技術的認可程度越來越高了,由此越來越多的玩家也能更快地享受到新版DLSS技術帶來的流暢游戲體驗。
RTX 4070硬件規格詳解

規格方面,RTX 4070采用了和RTX 4070 Ti同樣的AD104核心,只是有些許精簡。它擁有4組GPC、23組TPC,SM單元為46個,CUDA核心數量則為5888個。此外,紋理單元、光柵單元、RT Cores、Tensor Cores和二級緩存也對應的有所縮減,因此整體芯片的規模大約為RTX 4070 Ti的76.7%。GPU頻率部分,RTX 4070的最高加速頻率也略低于RTX 4070 Ti。不過,RTX 4070的顯存系統與RTX 4070 Ti是一樣的,都是12GB/192bit/GDDR6X,帶寬也同為504GB/s。

雖然和上代的兩款“70”相比,RTX 4070的GPC、TPC以及RT Cores和Tensor Cores并沒有數量優勢,但大家不要忘了它是采用的Ada Lovelace新架構,不但RT Cores和Tensor Cores全都領先一代,還采用了全新的SM單元設計,效率方面提升非常大,而且GPU的頻率也高出許多,因此綜合下來性能反而大幅增加。顯存規格方面也是如此,即便RTX 4070配備的是192bit顯存位寬,但容量高達8倍的二級緩存和更高的顯存頻率帶來了更高的數據交換效率提升,綜合下來性能反而大幅增長,由此也更加凸顯RTX 40系列高效的特性。官方給RTX 4070的性能定位是2K分辨率下提供超100FPS的電競級高幀率游戲體驗,從硬件規格來看,RTX 4070確實能夠擁有這樣的實力。
RTX 40系列還有一大特色就是高能效。從RTX 40開始,我們并不能簡單地以GPU功率輸出高低來判定其性能高低,這是因為RTX 40系列大多數時候在達到功率墻之前,就已經跑在極限頻率上輸出最高性能,所以從實測數據來看,RTX 40系列的游戲功率一般都會小于官方標注的整板功率值。
表格中的數據已經顯示RTX 4070平均游戲功率只有186W,這只是RTX 3070 Ti的77.5%,因此它對電源、散熱器的要求大大降低,不但降低了玩家的裝機成本,更低的風扇噪音也提升了使用體驗。由于功率的降低,廠商在生產RTX 4070時可以選擇使用16pin輔助供電,也可以選擇單8pin輔助供電,這對于喜歡高性能ITX小卡的玩家來說是個好消息。
紅色引力之環驅動的“行星探測器”
作為七彩虹iGame家族中定位高端的產品,Advanced系列在設計和用料上都非常用心。外觀方面,iGame GeForce RTX 4070 Advanced OC的設計靈感源于宇航飛行器及宇宙神秘天體“黑洞”。和棱角分明、霸氣粗獷的上代產品相比,這一代的iGame GeForce RTX 4070 Advanced OC采用了不同的設計風格,線條相對圓潤精致,造型上非常簡潔,在棱角處都做了圓弧過渡,兩側風扇處還有金屬斜切裝飾讓卡身顯得硬朗但不呆板。

主體采用銀黑配色,中間的標志性的紅圈風扇非常吸睛,由上代的能量核心進化為了“引力之環”,配合雙RGB燈組的視覺停留特效讓玩家享受光影盛宴。整塊GPU的外甲以“宇宙隕鐵”為靈感進行設計,滿載金屬感,沒有凸起和展示在外的熱管,銀黑色的涂裝加上黑色表面的類星空若隱若現的三角形紋理,看上去就像一艘正在用引力之環驅動的行星探測器。產品的“隕鐵背板”也很有特色,它除了擁有專屬于iGame風格的線條、圖騰裝飾,還在尾部打造出一個Logo形狀的鏤空區域,用以輔助機身內部熱量導出。

iGame GeForce RTX 4070 Advanced OC長寬高尺寸分別為343.5×150.2×53.5mm(帶擋片),玩家在選購前建議確認自己的機箱是否裝得下。同時,為了防止長時間使用GPU造成主板變形的情況,在包裝內還附贈一個支架。支架同樣采用全金屬材質和質感十足的銀色涂裝,底座上的Logo和限位器紅色涂裝等細節設計都展現出獨特的iGame美學。

風扇配置上,iGame GeForce RTX 4070 Advanced OC采用雙環型100mm+96mm三風扇設計。為了更好地展示燈效,中央風扇的扇葉為半透明配色,兩側風扇則升級為了結構緊湊的九翼聚風鐮環扇葉,能夠起到不錯的聚風增壓效果。風扇還采用雙滾珠軸承,轉動柔滑順暢且具有超長使用壽命。

iGame RTX 4070 Advanced OC散熱配置相對RTX 4070來說是非常豪華的。2.5槽設計能提供較大的散熱空間和更大的散熱模組,在散熱器的設計上,iGame RTX 4070 Advanced OC內部配備了4根采用回流焊工藝的8mm熱管,熱管與鰭片相接,再搭配全覆蓋式散熱面板之后,能優化散熱效能,帶來出色的散熱效果。

供電和接口部分,iGame GeForce RTX 4070 Advanced OC配備最新的12Pin+4pin輔助電源接口,包裝盒中附送一條轉接線,無論是使用新電源還是老電源的玩家都不用擔心兼容性問題。除此之外,該卡還附送了一個螺絲刀,上面印有iGame Logo,充分考慮到了玩家安裝使用的便利性。

產品提供了3個DP 1.4a接口和1個HDMI 2.1接口,輕松滿足用戶對于多個顯示設備的連接需求。作為iGame系列的標配,IO接口面板處依舊配備了一鍵超頻按鈕,按下后可切換到高性能模式,輕松實現超頻。

游戲性能測試:DLSS 3效率驚人,2K光追游戲輕松玩
測試平臺
處理器:Intel Core i9 13900K
內存:芝奇DDR5 6000 16GB×2
主板:華碩ROG MAXIMUS Z790 HERO
顯卡:iGame GeForce RTX 4070 Advanced OC
GeForce RTX 3070 Ti Founders Edition
GeForce RTX 4070 Ti
硬盤:WD_BLACK SN850X 2TB
電源:華碩ROG雷神1000W
操作系統:Windows 11專業版22H2
基準性能

從3DMark GPU的基準測試結果來看,相較于RTX 3070 Ti,iGame GeForce RTX 4070 Advanced OC的成績有了一定的提升,在FireStrike 和TimeSpy系列測試中,FireStrike Extreme、TimeSpy、TimeSpy EXTREME的成績的平均領先幅度超過19%,平均成績為RTX 4070 Ti的79%。在DX12U的專項測試SpeedWay中,RTX 4070相對RTX 3070 Ti高出20%。
光追性能部分,PortRoyal測試中,iGame GeForce RTX 4070 Advanced OC的成績領先RTX 3070 Ti 25%。RTX 4070光追項目DXR的成績為51.49fps,領先RTX 3070 Ti 51%,可以看出第三代的光追效率確實要高不少。
DLSS 2K分辨率測試中,iGame GeForce RTX 4070 Advanced OC相比RTX 3070Ti高了22%。DLSS 3測試中,RTX 4070在開啟DLSS 3后幀率大約達到原生4K的4倍,幀率達到96.39fps,而用來對比的RTX 3070 Ti在4K下的DLSS 2測試成績僅為53.44fps,領先幅度高達80%。同時,在這里也可以看到RTX 3070 Ti不開DLSS時只有5 fps,說明8GB顯存真的不夠用了。
綜合基準測試得分來看,iGame GeForce RTX 4070 Advanced OC的性能差不多是RTX 4070 Ti的80%左右,而對比上代RTX 3070 Ti的綜合提升則達到了20%,可見這款產品的定位也是卡得非常準的。而在開啟DLSS 3的情況下,RTX 4070的性能優勢相比RTX 3070 Ti是很大的。如果玩家買了RTX 4070,建議在游戲中開啟DLSS 3從而獲得更大性能提升。
光柵化游戲性能

接下來我們進入實際的游戲測試,NVIDIA官方給RTX 4070的定位是2K高幀游戲體驗,不過我們也加入了4K下的成績,方便大家參考。先來看看純光柵游戲的表現,在2K分辨率下,iGame GeForce RTX 4070 Advanced OC平均幀率相對RTX 3070 Ti提升了20%左右,部分游戲的領先幅度超過35%,可以達到RTX 4070 Ti 82%的性能。隨著分辨率來到4K,RTX 4070領先優勢有所降低,平均幀率比RTX 3070 Ti高15%,達到RTX 4070 Ti 80%的性能,。
光追+DLSS游戲性能

接下來是開了光追和DLSS之后的游戲測試,在2K原生分辨率下,iGame GeForce RTX 4070 Advanced OC都保持了13%~30%的優勢,平均提升幅度達到40%。4K光追中我們加入了DLSS項目,可以看到,在原生4K分辨率下,RTX 4080的平均提升幅度為22%。打開DLSS 3之后,RTX 4070的提升在12%~46%,平均為22%。4K下開啟DLSS 3平均提升則為23%。
iGame GeForce RTX 4070 Advanced OC的光追和張量單元數量都不如RTX 3070Ti卻能實現大幅反超,可見新版RT Cores和Tensor Cores的效率顯然是高不少的。從幀率上看,RTX 3070 Ti已經無法保證大部分4K游戲幀率達到60fps以上,而RTX 4070開啟DLSS后幾乎所有參測游戲都可以達到60fps以上的幀率,部分游戲超過80fps。和RTX 4070Ti對比的話,整體性能也差不多是它的81%左右。

DLSS 3是RTX 40系列的重點技術,接下來我們分別測試了2K分辨率下RTX 4070原生、開啟DLSS 2以及開啟DLSS 3的游戲幀率。從測試來看,iGame GeForce RTX 4070 Advanced OC在只打開DLSS 2(DLSS 3關閉幀生成)的情況下,對比RTX 3070 Ti的提升在10%~27%,只有幾款游戲幀率破百。開啟DLSS 3后,《賽博朋克2077》幀率直接達到了原生分辨率的的2.25倍,平均游戲幀率領先幅度為70%,并且參測的所有游戲的幀率都突破了120fps。在DLSS 3的加持下,RTX 4070確實可以實現“2K百幀”光追游戲體驗。

DLSS 3除了可以大幅提升游戲幀率降低幀延遲外,本身也包含了Reflex,因此綜合下來可以顯著降低游戲延遲,提升玩家操控的響應速度和流暢度。從FrameView監測的PCL延遲來看,開啟DLSS 3后,絕大多數游戲的延遲都大幅下降。

DLSS 3畫質方面,從《瘟疫傳說:安魂曲》的截圖可以看到,即便是DLSS 3性能模式,畫面細節方面和原生也幾乎沒有什么差別,其畫面精度也完全不輸原生4K,質量模式更是完全看不出差別了。因此,用RTX 40系GPU玩支持DLSS 3的游戲能獲得畫面細節更豐富、幀率更高,操控延遲更低的絲滑流暢游戲體驗。
生產力性能測試

接下來看看生產力方面的表現,Blender Benchmark 3.3中,iGame GeForce RTX 4070 Advanced OC對比RTX 3070 Ti提升也很明顯,其中monster和classroom的提升分別為55%和48%,junkshop有24%的提升。RTX 4070 Ti在V-Ray中的表現比較不錯,使用RTX的提升為27%,使用CUDA的提升為20%,而OC渲染器中的性能提升則可以到達34%~43%。
SPECView包含了大量的工業軟件測試項目,在2020V3.1版本中,iGame GeForce RTX 4070 Advanced OC的提升還是很明顯的。其中Energy能源測試集的提升最大,領先RTX 3070 Ti 82%以上,平均領先幅度達到28%。由于RTX 4070有12GB顯存,所以其3D渲染類生產力表現比8GB的RTX 3070 Ti好不少。
視頻剪輯方面,從Premiere Pro 2023來看,iGame GeForce RTX 4070 Advanced OC也是強過RTX 3070 Ti的。而編碼輸出方面,RTX 4070新版編碼器效率不錯,不但支持AV1,而且H.265編碼速度相對RTX 3070 Ti同樣有明顯的效率提升。

iGame GeForce RTX 4070 Advanced OC的搭載AV1硬件編碼,那么它相比目前主流的H.264編碼有什么優勢呢?下面我們就對同碼率下,AV1和H.264視頻的畫質進行對比測試。從我們錄制的《賽博朋克2077》游戲視頻截圖對比(都為4K/60fps/10Mbps碼率)來看,AV1編碼的畫質比H.264好得多,背后的柵欄邊緣平滑度和更后面的陰影都完整地展現了出來,畫面上部分金屬管道的質感還原接近原生畫面,畫面質量和精度遠超同碼率下的H.264編碼視頻。對于有視頻轉碼需求的用戶來講,支持AV1硬件編碼的RTX 4070無疑更加值得選擇。

(對比視頻截圖來自B站視頻開啟VSR和關閉VSR的畫面)
VSR(視頻超分辨率)是最近NVIDIA為RTX 30和RTX 40系列推出的新技術,可以通過AI計算對視頻實現一鍵升級清晰度,目前已經支持網絡視頻,而支持本地視頻的VLC播放器也將隨RTX 4070首發,我們試用了預覽版測試,效果十分明顯。從視頻截圖可以看到,開啟VSR(選擇“質量4”)之后,畫面上的字體邊緣明顯銳利了很多,整體畫面精度也得到了提升,效果是非常顯著的。而且理論上只要是使用支持VSR的瀏覽器,網絡視頻就可能享受此項技術,例如B站。推薦RTX 30和RTX 40用戶在觀看在線和本地視頻時都開啟此項功能。
AI加速內容創作


AI應用在今年突然井噴,普及速度之快令人吃驚,未來AI必將成為日常工作必須掌握的技能。我們知道NVIDIA很早就開始布局AI計算,CUDA的生態圈在業界無可匹敵,到了RTX 40時代,更是成為了AI應用的必備利器。這里我們就用Stable Diffusion來測試iGame GeForce RTX 4070 Advanced OC在AI出圖方面的性能。出圖的參數配置如圖,從測試成績可以看到,RTX 4070每分鐘可以出圖9.1張,速度是RTX 3070 Ti的1.32倍,是RTX 4070 Ti的85%。當然,大家也可以看到,CPU很顯然不適合作這樣的并行計算,就算Core i9 13900K,出圖速度也只有RTX 4070的0.9%不到。此外,如果出圖分辨率更高,對顯存容量的要求也會更高,這方面12GB顯存的RTX 4070無疑也比8GB顯存的RTX 3070 Ti更有優勢。
功耗與溫度測試
七彩虹iGame GeForce RTX 4070 Advanced OC作為一款超公版RTX 4070,頻率設定方面自然要高于公版標準,在默認模式下核心頻率1920~2475MHz,通過一鍵超頻模式,可輕松實現1920~2610MHz的超頻,性能方面會有更好的表現。

在一鍵超頻模式下,使用FurMark考機,iGame GeForce RTX 4070 Advanced OC的整卡功率達到了221.1 W。同時,我們也注意到滿載考機的情況下,GPU最高溫度只有54.1℃,熱點溫度不到65℃,顯存溫度也僅有44℃,散熱表現非常優秀。iGame GeForce RTX 4070 Advanced OC在TimeSpy中的實際游戲頻率高達2895MHz。


鑒于產品優秀的散熱表現,我們還對其進行了簡單的超頻,經過超頻iGame GeForce RTX 4070 Advanced OC的游戲頻率最終達到了3045MHz,在TimeSpy Extreme GPU測試中分數達到了9523。測試時的GPU溫度來到了58.5℃,熱點溫度為74.6℃,顯存溫度變化不大,此時GPU的平均TGP約245.9W,總體表現相當出色。

總結:萬元內裝機好選擇,2K高幀電競新體驗
使用NVIDIA Ada Lovelace架構的RTX 40系列GPU實現了性能上的飛躍,而第三代RT Cores和第四代Tensor Cores也讓游戲與生產力應用中的光追與AI加速提升到了一個新的水平。全新加入的光流加速器,讓DLSS 3技術的AI幀生成得以實現,大幅增加了游戲幀率。RTX 4070作為2K游戲甜品,從實測來看在DLSS 3的加持下可以輕松實現2K分辨率下的高幀光追游戲。
生產力部分,無論是3D渲染類還是視頻剪輯類應用,RTX 4070相對RTX 3070 Ti都有明顯的效率提升,同時12GB GDDR6X大顯存也帶來了更多的優勢。當下火熱的AI應用中,RTX 4070憑借全新的架構也帶來了更強悍的生產力效率,對于著眼未來AI應用的玩家來講,也確實是一款必備的甜品級高效利器。
在超公版RTX 4070中,七彩虹iGame GeForce RTX 4070 Advanced OC擁有扎實的用料、豪華的散熱規格,太空風格的性化外觀更是抓住了顏控玩家的審美。游戲性能相比3070Ti提升20%、DLSS3提升70%,生成式AI創作性能相比3070 Ti提升40%,再加上200W左右的低功耗,性價比超過70/80級別產品,是性能級游戲玩家和AI用戶的萬元內裝機好選擇。