本帖最後由 s84292 於 2025-3-27 10:27 編輯
ASUS TUF 4090 24GB vs
GALAXY 最平個張5090D 32GB
(散熱真係好差, 之前TUF 煲爆440W 都係75度,風扇只係60%左右
呢張GALAXY 575W去到86度 VRAM 90度(觸發保護) ,風扇8X%, 最大轉速仲有高頻聲勁煩
要降到500W黎行---反而快左,應該因為係575W過熱一直有降頻)
===更新-原來有一把風扇係唔識轉,已解決===
超到盡 2.9ghz 核心+ 34ghz vram只係 78度核心+84度vram
即使已經過左個半月, comfyui 同 kohya_ss 預設同dev版本都不支持RTX5090 /D
手動修改為touch 2.7及cuda12.8 後正常運作,但不支持xformers
相同的測試參數和數據集(5090d 不能開xformers,故開了sdpa)
SDXL--zero_terminal_snr --v_parameterization
1024X1024分桶 89張相--有分FOLDER 8 16 次這樣,一輪540 step 共三輪
batch size 2
4090: 23分39秒
5090D: 23分59秒
batch size 8
4090: 11分19秒
5090D: 8分39秒
batch size 16
4090: VRAM不足無法進行
5090D: 5分10秒
AB對比下兩張卡訓練的LORA,2-8 batch size 畫面幾乎完全一樣
comfyui SDXL出圖 (1024X1280) + 面部修復 + 2x升頻
4090: 9.12秒
5090d: 8.32秒
一路打戰艦世界(最高畫質3440x1440 120hz,不開fsr)
一路背後做訓練4 batchsize
4090: 60分39秒
5090D: 41分59秒
如果你只係想訓下圖,做下lora 訓練,可以慳返~除非你行大batch size
或者好像我咁一路打機一路訓練  |