電腦領域 HKEPC Hardware - Powered by Discuz! Board

標題: AMD嗰ROCm嘅HIP組件係會做CUDA轉ROCm A卡都行到大路AI野 [打印本頁]

作者: Okt04175 時間: 2024-9-11 14:38 標題: AMD嗰ROCm嘅HIP組件係會做CUDA轉ROCm A卡都行到大路AI野

FB群組嘅內容搬過嚟：
「第一個Post：
幫部份冇追貼AMD發展嘅人更新下認知，而家ROCm係對應CUDA，最新版本已經去到6.1.2版，之前5.6/5.7版出埋Windows版已經係上年年尾嘅事。

ROCm嗰HIP Runtime係可以對應返CUDA Runtime，喺用CUDA同埋幾個主流AI Framework嘅情況下唔使專登改Code就可以直接Call嗰AMD GPU做嘢。
次旗艦/旗艦級RDNA2架構同埋全部RDNA3架構嘅GPU喺Windows上面除咗支援ROCm嘅Runtime亦支援埋SDK。

Detail部份有興趣就自己慢慢睇ROCm嘅說明啦。
https://rocm.docs.amd.com/projects/install-on-windows/en/latest
.」

「第二個Post：
AMD 發佈 #ROCm 6.2，有新組件同改善PyTorch以及TensorFlow嘅支援
https://www.phoronix.com/news/AMD-ROCm-6.2-Released
.
//除了新的軟體元件之外，ROCm 6.2 的數學函式庫現在預設使用 Clang 編譯器而不是 HIPCC。還提供了更好的 PyTorch 支持，啟用了 v2.2/v2.3，並且 TensorFlow 整合現在適用於 TensorFlow 2.16。 ROCm PyTorch 支援現在還包括對 Autocast 作為自動混合精確度模式的支援。也為 OpenCLX 引入了最佳化的本機框架支援。

ROCm 6.2 進一步為「bitsandbytes」模型量化提供記憶體節省，改進 vLLM 支援並增強 AMD Instinct 加速器的效能調整。在 vLLM 方面，大型語言模型現在有 FP16 和 BF16 精度，並且 Llama 也支援 FP8。還有關於多 GPU 執行的額外工作以及 vLLM 支援的其他改進。//」

作者: s84292 時間: 2024-9-15 15:20

本帖最後由 s84292 於 2024-9-15 07:26 編輯

如果只係要推理唔洗訓練, amd可以考慮
有訓練lora 或微調模型, 就唔洗諗選amd家用卡
一來amd cut 左算力,二來好多現成野行唔到,
而你好難搵到討論或者現成的解決方案

如果打算只係平時windows 內行下,都唔建議amd, windows支持好差
唔似nv咁有咁多gui 工具已經有支持

行到唔會出錯快唔快係三件事

加上下一代amd講明唔會出高階家用卡, vram 20gb 應該係盡頭
除非真係打算買amd 專業卡,唔係真係冇理由依家入坑amd

作者: usei 時間: 2024-9-16 00:34

我相信大部分軟件會更新支援 A 卡 / NPU

特別是 NPU 普及後

作者: s84292 時間: 2024-9-16 10:08

我相信大部分軟件會更新支援 A 卡 / NPU

特別是 NPU 普及後
usei 發表於 2024-9-15 16:34

應該都要好耐

畢竟桌面機RYZEN 9000系都冇NPU，恐怕都要等到2026 zen6先有

apu又只有最頂兩粒有，入門中階都冇

作者: raylee 時間: 2024-9-16 11:35

NPU seems only for resources constrained...even after years of 2026

作者: usei 時間: 2024-9-16 12:30

回覆 4# s84292

如果 Lunar lake 普及度高
更新支援 NPU 機會就會增加

做得 intel NPU 支援唔差在再做 AMD

作者: cngaiyin 時間: 2024-9-16 18:13

確實係有呢回事既ROCm可以行到CUDA
不過都係果句啦
用緊AMD就當係額外既驚喜囉
如果真係要買就買翻Nvda
唔好成日有咩"戰未來"既想法
簡卡係簡當下佢可以做到D咩而唔係期待佢未來可以做D咩

(利申:用緊7800XT)

作者: chunkymunkey 時間: 2024-9-16 23:24

應該都要好耐

畢竟桌面機RYZEN 9000系都冇NPU，恐怕都要等到2026 zen6先有
apu又只有最頂兩粒 ...
s84292 發表於 2024-9-16 10:08

AI 唔同10幾年前integrated graphic硬解video, 唔係就咁到達主流解像度+格數就可以基本上收工,真係用起上嚟所要嘅運算能力基本上無上限咁濟
個人覺得,NPU幫到手嘅地方其實好有限下,去返desktop基本上無用咁滯,因為GPU快幾十條街
就算laptop 都好,unless 你真係覺得privcy 好緊要,用internet 叫對面幫手搞應該仍然係最慳皮嘅方案

作者: 010 時間: 2024-9-17 20:42

乜AMD仲有得玩?
之前唔係N出招要封殺死A唔可以用乜乜code/編譯器去行CUDA咩?

作者: Okt04175 時間: 2024-9-18 11:12

乜AMD仲有得玩?
之前唔係N出招要封殺死A唔可以用乜乜code/編譯器去行CUDA咩? ...
010 發表於 2024-9-17 20:42

被封殺嘅係ZLUDA，因為開發過程用咗CUDA SDK。但係ROCm嗰HIP開發過程冇用到CUDA SDK ，所以NVIDIA咬唔到AMD嘅ROCm。

作者: Okt04175 時間: 2024-9-24 20:13

本帖最後由 Okt04175 於 2024-9-24 20:16 編輯

回覆 2# s84292
我用Linux系統，所以首選係A卡行ROCm，相容到CUDA已經收貨，反正我唔會練丹(訓練AI模型)只係想用AI程式，可以慳返唔使畀老黃劏荷包。

而家啲AI程式唔係用PyTorch就係用TensorFlow，兩大AI程式Framework都已經支援晒ROCm。

作者: s84292 時間: 2024-9-26 09:19

回覆 s84292
我用Linux系統，所以首選係A卡行ROCm，相容到CUDA已經收貨，反正我唔會練丹(訓練AI模型)只係 ...
Okt04175 發表於 2024-9-24 12:13

我一半以上時間係訓練，訓練完再用
基本上都係硬食

anyway如果只係使用現有模型，我多數cloud平台算數，唔洗搞咁多野

作者: leaf_chan 時間: 2024-9-29 19:07

本帖最後由 leaf_chan 於 2024-9-29 19:09 編輯

可否請有AMD6000或7000系顯示卡的師兄幫忙測試下，AMD顯示卡，能否推動Whisper Desktop和Faster Whisper的語音轉文字AI軟件正常運作？

Whisper Desktop (只可以用larger v2模型)
Whisper Desktop

Faster Whisper (可以用larger v3模型)
Faster Whisper

此軟件對聽障人士幫助極大，曾有同路人向小弟查詢AMD顯示卡能否run上述的軟件，但小弟沒有AMD顯示卡無法回答。

希望師兄幫忙，功德無量

via HKEPC IR 5.1.14 - Android(5.1.2F)

作者: ming94816 時間: 2024-11-1 09:40

回復 13 #leaf_chan
用過780M ok

via HKEPC Reader for Android

作者: leaf_chan 時間: 2024-11-4 09:07

本帖最後由 leaf_chan 於 2024-11-4 09:10 編輯

回復 leaf_chan
用過780M ok

via HKEPC Reader for Android
ming94816 發表於 2024-11-1 09:40

謝謝你的幫忙，麻煩請回答以下問題，讓我的朋友知道全面的資料：

1）用緊whisper desktop定Faster whisper?抑或二者都有試過？

2）AMD 780M，是否指AMD Radeon 780M內顯？

3）請提供一下你的電腦specification？

4）本身無字幕的影片，是甚麼語言？

5）影片時間有多長？

6）利用軟件生成srt字幕檔，要多長時間？

7）生成srt字幕前，有甚麼特別設定？

好多問題，煩請師兄幫忙解答，謝謝

PS: 因Budget所限，我朋友偏向性價比高的AMD顯示卡，但求能運行字幕軟件就OK，So需要全面的資料。

via HKEPC IR 5.1.14 - Android(5.1.2F)

作者: mlyu 時間: 2024-11-4 11:55

Faster Wisper GUI 入面淨係俾 CPU/GPU/AUTO 你揀
唔似用到粒 780m 喎

作者: aswdv 時間: 2024-11-5 22:30

本帖最後由 aswdv 於 2024-11-6 00:12 編輯

Tomshardware 有做過Whisper GPU benchmark可以參考

https://www.tomshardware.com/new ... on-gpus-benchmarked

作者: leaf_chan 時間: 2024-11-7 21:11

本帖最後由 leaf_chan 於 2024-11-7 21:14 編輯

Tomshardware 有做過Whisper GPU benchmark可以參考
aswdv 發表於 2024-11-5 22:30

謝謝師兄的資訊
原來AMD和Intel ARC顯示卡，能run到whisper desktop，但某些軟件eg. whisper OpenAI軟件，就只有Nvidia顯示卡才能run。

看來我的friend無得揀了，只能用whisper desktop。
via HKEPC IR 5.1.14 - Android(5.1.2F)