為解決 RTX 40 中高階型號吸引力不足,NVIDIA 祭出了半代更新 RTX 40 SUPER 救市,緊接登場是 GeForce RTX 4070 Ti SUPER 顯示卡,升級至 AD103-275 繪圖核心,不僅 CUDA Cores 增量約 10% 至 8,448 個,同時記憶體介面由 192-bit 增至 256-bit、記憶體容量由 12GB 增至 16GB GDDR6X,更重要是增量不加價,MSRP 定價維持在 US$799。HKEPC 編輯部找來了 GeForce RTX 4070 Ti SUPER 與 RTX 4070 Ti 及 RTX 4080 作對比測試。
RTX 40 SUPER 第二炮 : 4070 Ti SUPER
NVIDIA 23 日正式發布全新效能級 GeForce RTX 4070 Ti SUPER 顯示卡,這是 RTX 40 SUPER 系列的第二炮,CUDA Core 數目相較 RTX 4070 Ti 提升 9.92%、記憶體容量增加 33.33%,但增量不加價,MSPR 定價保持在 US$799 美元水平,緊接下來還會有一張 RTX 4080 SUPER 型號登場在 31 日登場。
由於過去並沒有 Ti 和 SUPER 同時出現的情況,玩家一直以為 SUPER 的型號定位在 Ti 之下,實際上 NVIDIA 官方是把 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。
有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,玩家們批評 RTX 40 中高階型號性價比欠奉、吸引力很低。
舉例 RTX 2070 SUPER 是 TU102 Full Chip 規模的 55.56%,RTX 3070 Ti 是 GA102 Full Chip 規模的 57.14%,沒想到 RTX 4070 Ti 竟然只有 AD102 Full Chip 規模的 41.67%,晶片規模甚至低於舊代主流卡 RTX 2060 SUPER (47.22%) 及 RTX 3060 Ti (45.24%) ,要知道這張 RTX 4070 Ti 曾計劃命名為 RTX 4080 12GB、定價 US$899,結果受到各方強烈批評才作罷。
為何 RTX 40 新卡的規格變得如此保守呢 ? 礦難後大量二手卡湧現、舊代 RTX 30 庫存嚴重,加上全球經濟低迷,如果 RTX 40 規格過於強大,AIC 手上的 RTX 30 庫存就會全變死貨,因此 NVIDIA 當初設定 RTX 40 規格時需要考慮 AIC 手上的RTX 30 庫存壓力,只能將 RTX 40 中高階型號規格用刀法劈深一點,賣點變成以 DLSS 3 Frame Gen 技術為主,讓 AIC 有機會把手上的 RTX 30 舊卡清掉以免屍橫遍野。
為了讓 RTX 30 庫存能安全過渡,卻造成 RTX 40 中高階新卡吸引力不足,因此當 RTX 30 庫存清得 8899 後,也是時候將 RTX 40 中高階型號推倒重來了 。
撥亂反正的 RTX 40 SUPER
對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 SUPER 的 CUDA Core 相較 RTX 4070 增加了 20%,MSPR 定價 US$599 取代 RTX 4070 沿有定位,但 GeForce RTX 4070 並不會停產,而是向下調至 US$499 美元。
RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會完全取代舊型號,RTX 4070 Ti 及 RTX 4080 即時停產,RTX 4080 SUPER 的 MSRP 定價更會降至 US$999,想當年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 卻敢賣 US$1,199,真是哪來的勇氣啊,玩家們都說:「畀多少少錢,買 RTX 4090 好過啦」。
這次的主角 GeForce RTX 4070 Ti SUPER 規格也有著明顯進步,不僅 CUDA Cores 相較 RTX 4070 Ti 增加了 9.92%,回到 AD102 Full Chip 規格的 45.83%,同時記憶體介面由 192-bit 升級至 256bit,GDDR6X 記憶體容量由 12GB 提升至 16GB,記憶體頻寬由 504GB/s 提升至 672GB/s,這對於高解析度遊戲性能及複雜 AI 運算帶來了明顯的性能改善,更重要是 MSPR 售價維持 US$799,增量不加價,令 NVIDIA RTX 40 產品線回復應有的吸引力。
NVIDIA AD103-275 繪圖核心
由於 RTX 4070 Ti 規格已經是 AD104 繪圖核心的完全體,因此 RTX 4070 Ti SUPER 需要使用再高一階的 AD103 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,採用 TSMC 4N NVIDIA Custom 制程,擁有 459 億個電晶體、 Die Size 379mm² ,完整的 AD103 晶片內建 7 個 GPC 單元、 40 個 TPC 紋理處理群集及 80 個 SM 串流多處理器,具備 10240 個 CUDA Cores、80 個 RT Cores 及 320 個 Tensor Cores。
▲ NVIDIA AD103-275 Block Diagram
不過,GeForce RTX 4070 Ti SUPER 將部份單元作出了屏蔽,AD103-275 晶片刪減至 6 個 GPC 單元, 33 個 TPC 紋理處理群集及 66 個 SM 串流多處理器,具備 8,448 個 CUDA Cores、66 個 RT Cores 及 264 個 Tensor Cores。
核心時脈方面,NVIDIA GeForce RTX 4070 Ti SUPER FE 預設時脈 2,340MHz、Boost 時脈為 2,610MHz,最高 TDP 與 RTX 4070 Ti 一樣維在 285W。
記憶體方面,NVIDIA GeForce RTX 4070 Ti SUPER 由 192-bit 增至 256-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,記憶體容量由 12GB 大幅提升至 16GB,最高記憶體頻寬由 504GB/s 提升至 672GB/s,對於需要較大記憶體容量或頻寬的遊戲及 AI 應用,將會有明顯的性能增長。
NVIDIA GeForce RTX 4070 Family Full Specifications
Graphics Card | GeForce RTX 4070 Founders Edition | GeForce RTX 4070 SUPER Founders Edition | GeForce RTX 4070 Ti Founders Edition | GeForce RTX 4070 Ti SUPER Reference Design |
GPU SKU | AD104-250 | AD104-350 | AD104-400 | AD103-275 |
GPU Architecture | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace |
GPCs | 4 | 5 | 5 | 6 |
TPCs | 23 | 28 | 30 | 33 |
SMs | 46 | 56 | 60 | 66 |
CUDA Cores / SM | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 5888 | 7168 | 7680 | 8448 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 184 (4th Gen) | 224 (4th Gen) | 240 (4th Gen) | 264 (4th Gen) |
RT Cores | 46 (3rd Gen) | 56 (3rd Gen) | 60 (3rd Gen) | 66 (3rd Gen) |
Frame Buffer Memory Size and Type | 12GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X | 16GB GDDR6X |
Memory Interface | 192-bit | 192-bit | 192-bit | 256-bit |
Memory Clock (Data Rate) | 21 Gbps | 21 Gbps | 21 Gbps | 21 Gbps |
Memory Bandwidth | 504 GB/sec | 504 GB/sec | 504 GB/sec | 672 GB/sec |
ROPs | 64 | 80 | 80 | 96 |
L1 Data Cache/SharedMemory | 5888 KB | 7168 KB | 7680 KB | 8448 KB |
L2 Cache | 36864 KB | 49152 KB | 49152 KB | 49152 KB |
Video Engines | 1x NVENC (Gen8) 1x NVDEC (Gen5) | 1x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) |
TGP Power | 200W | 220W | 285W | 285W |
Transistor Count | 35.8 Billion | 35.8 Billion | 35.8 Billion | 45.9 Billion |
Die Size | 294.5mm² | 294.5mm² | 294.5mm² | 379.0mm² |
Manufacturing Process | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
PCIe Interface | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 |