2024-01-23
CORE +10%、VRAM +33%
NVIDIA GeForce RTX 4070 Ti SUPER 實測
文: John Lam / 評測中心


為解決 RTX 40 中高階型號吸引力不足,NVIDIA 祭出了半代更新 RTX 40 SUPER 救市,緊接登場是 GeForce RTX 4070 Ti SUPER 顯示卡,升級至 AD103-275 繪圖核心,不僅 CUDA Cores 增量約 10% 至 8,448 個,同時記憶體介面由 192-bit 增至 256-bit、記憶體容量由 12GB 增至 16GB GDDR6X,更重要是增量不加價,MSRP 定價維持在 US$799。HKEPC 編輯部找來了 GeForce RTX 4070 Ti SUPER 與 RTX 4070 Ti 及 RTX 4080 作對比測試。



RTX 40 SUPER 第二炮 : 4070 Ti SUPER

 

RTX 4070 SUPER

 

 

NVIDIA 23 日正式發布全新效能級 GeForce RTX 4070 Ti SUPER 顯示卡,這是 RTX 40 SUPER 系列的第二炮,CUDA Core 數目相較 RTX 4070 Ti 提升 9.92%、記憶體容量增加 33.33%,但增量不加價,MSPR 定價保持在 US$799 美元水平,緊接下來還會有一張 RTX 4080 SUPER 型號登場在 31 日登場。

 

由於過去並沒有 Ti  和 SUPER 同時出現的情況,玩家一直以為 SUPER 的型號定位在 Ti 之下,實際上 NVIDIA 官方是把 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。

 

 

RTX 4070 Ti

 

 

有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,玩家們批評 RTX 40 中高階型號性價比欠奉、吸引力很低。

 

舉例 RTX 2070 SUPER 是 TU102 Full Chip 規模的 55.56%,RTX 3070 Ti 是 GA102 Full Chip 規模的 57.14%,沒想到 RTX 4070 Ti 竟然只有 AD102 Full Chip 規模的 41.67%,晶片規模甚至低於舊代主流卡 RTX 2060 SUPER (47.22%) 及 RTX 3060 Ti (45.24%) ,要知道這張 RTX 4070 Ti 曾計劃命名為 RTX 4080 12GB、定價 US$899,結果受到各方強烈批評才作罷。

 

 

RTX 4070 SUPER

 

 

為何 RTX 40 新卡的規格變得如此保守呢 ?  礦難後大量二手卡湧現、舊代 RTX 30 庫存嚴重,加上全球經濟低迷,如果 RTX 40 規格過於強大,AIC 手上的 RTX 30 庫存就會全變死貨,因此 NVIDIA 當初設定 RTX 40 規格時需要考慮 AIC 手上的RTX 30 庫存壓力,只能將 RTX 40 中高階型號規格用刀法劈深一點,賣點變成以 DLSS 3 Frame Gen 技術為主,讓 AIC 有機會把手上的 RTX 30 舊卡清掉以免屍橫遍野。

 

為了讓 RTX 30 庫存能安全過渡,卻造成 RTX 40 中高階新卡吸引力不足,因此當 RTX 30 庫存清得 8899 後,也是時候將 RTX 40 中高階型號推倒重來了 。

 

 

 

撥亂反正的 RTX 40 SUPER

 

RTX 4070 SUPER

 

 

對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 SUPER 的 CUDA Core 相較 RTX 4070 增加了 20%,MSPR 定價 US$599 取代 RTX 4070 沿有定位,但 GeForce RTX 4070 並不會停產,而是向下調至 US$499 美元。

 

RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會完全取代舊型號,RTX 4070 Ti 及 RTX 4080 即時停產,RTX 4080 SUPER 的 MSRP 定價更會降至 US$999,想當年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 卻敢賣 US$1,199,真是哪來的勇氣啊,玩家們都說:「畀多少少錢,買 RTX 4090 好過啦」。

 

 

RTX 4070 SUPER

 

 

這次的主角 GeForce RTX 4070 Ti SUPER 規格也有著明顯進步,不僅 CUDA Cores 相較 RTX 4070 Ti 增加了 9.92%,回到 AD102 Full Chip 規格的 45.83%,同時記憶體介面由 192-bit 升級至 256bit,GDDR6X 記憶體容量由 12GB 提升至 16GB,記憶體頻寬由 504GB/s 提升至 672GB/s,這對於高解析度遊戲性能及複雜 AI 運算帶來了明顯的性能改善,更重要是 MSPR 售價維持 US$799,增量不加價,令 NVIDIA RTX 40 產品線回復應有的吸引力。

 

 

 

NVIDIA  AD103-275 繪圖核心

 

由於 RTX 4070 Ti 規格已經是 AD104 繪圖核心的完全體,因此 RTX 4070 Ti SUPER 需要使用再高一階的 AD103 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,採用 TSMC 4N NVIDIA Custom 制程,擁有 459 億個電晶體、 Die Size 379mm² ,完整的 AD103 晶片內建 7 個 GPC 單元、 40 個 TPC 紋理處理群集及 80 個 SM 串流多處理器,具備 10240 個 CUDA Cores、80 個 RT Cores 及 320 個 Tensor Cores。

 

 

RTX 4070 SUPER

▲ NVIDIA AD103-275 Block Diagram

 

 

不過,GeForce RTX 4070 Ti SUPER 將部份單元作出了屏蔽,AD103-275 晶片刪減至 6 個 GPC 單元, 33 個 TPC 紋理處理群集及 66 個 SM 串流多處理器,具備 8,448 個 CUDA Cores、66 個 RT Cores 及 264 個 Tensor Cores。

 

核心時脈方面,NVIDIA GeForce RTX 4070 Ti SUPER FE 預設時脈 2,340MHz、Boost 時脈為 2,610MHz,最高 TDP 與 RTX 4070 Ti 一樣維在 285W。

 

 

RTX 4070 Ti SUPER

 

 

記憶體方面,NVIDIA GeForce RTX 4070 Ti SUPER 由 192-bit 增至 256-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,記憶體容量由 12GB 大幅提升至 16GB,最高記憶體頻寬由 504GB/s 提升至 672GB/s,對於需要較大記憶體容量或頻寬的遊戲及 AI 應用,將會有明顯的性能增長。

 

 

NVIDIA GeForce RTX 4070 Family Full Specifications

Graphics CardGeForce
RTX 4070
Founders Edition
GeForce
RTX 4070 SUPER
Founders Edition
GeForce
RTX 4070 Ti
Founders Edition
GeForce
RTX 4070 Ti SUPER
Reference Design
GPU SKUAD104-250AD104-350AD104-400AD103-275
GPU ArchitectureNVIDIA
Ada Lovelace
NVIDIA
Ada Lovelace
NVIDIA
Ada Lovelace
NVIDIA
Ada Lovelace
GPCs4556
TPCs23283033
SMs46566066
CUDA Cores / SM128128128128
CUDA Cores / GPU5888716876808448
Tensor Cores / SM4 (4th Gen)4 (4th Gen)4 (4th Gen)4 (4th Gen)
Tensor Cores / GPU184 (4th Gen)224 (4th Gen)240 (4th Gen)264 (4th Gen)
RT Cores46 (3rd Gen)56 (3rd Gen)60 (3rd Gen)66 (3rd Gen)
Frame Buffer Memory Size and Type12GB GDDR6X12GB GDDR6X12GB GDDR6X16GB GDDR6X
Memory Interface192-bit192-bit192-bit256-bit
Memory Clock (Data Rate)21 Gbps21 Gbps21 Gbps21 Gbps
Memory Bandwidth504 GB/sec504 GB/sec504 GB/sec672 GB/sec
ROPs64808096
L1 Data Cache/SharedMemory5888 KB7168 KB7680 KB8448 KB
L2 Cache36864 KB49152 KB49152 KB49152 KB
Video Engines1x NVENC (Gen8)
1x NVDEC (Gen5)
1x NVENC (Gen8)
1x NVDEC (Gen5)
2x NVENC (Gen8)
1x NVDEC (Gen5)
2x NVENC (Gen8)
1x NVDEC (Gen5)
TGP Power200W220W285W285W
Transistor Count35.8 Billion35.8 Billion35.8 Billion45.9 Billion
Die Size294.5mm²294.5mm²294.5mm²379.0mm²
Manufacturing ProcessTSMC 4NTSMC 4NTSMC 4NTSMC 4N
PCIe InterfaceGen4 x16Gen4 x16Gen4 x16Gen4 x16

 

發表評論