AMD嗰ROCm嘅HIP組件係會做CUDA轉ROCm A卡都行到大路AI野
FB群組嘅內容搬過嚟:
「第一個Post:
幫部份冇追貼AMD發展嘅人更新下認知,而家ROCm係對應CUDA,最新版本已經去到6.1.2版,之前5.6/5.7版出埋Windows版已經係上年年尾嘅事。
ROCm嗰HIP Runtime係可以對應返CUDA Runtime,喺用CUDA同埋幾個主流AI Framework嘅情況下唔使專登改Code就可以直接Call嗰AMD GPU做嘢。
次旗艦/旗艦級RDNA2架構同埋全部RDNA3架構嘅GPU喺Windows上面除咗支援ROCm嘅Runtime亦支援埋SDK。
Detail部份有興趣就自己慢慢睇ROCm嘅說明啦。
https://rocm.docs.amd.com/projects/install-on-windows/en/latest
.」
「第二個Post:
AMD 發佈 #ROCm 6.2,有新組件同改善PyTorch以及TensorFlow嘅支援
https://www.phoronix.com/news/AMD-ROCm-6.2-Released
.
//除了新的軟體元件之外,ROCm 6.2 的數學函式庫現在預設使用 Clang 編譯器而不是 HIPCC。還提供了更好的 PyTorch 支持,啟用了 v2.2/v2.3,並且 TensorFlow 整合現在適用於 TensorFlow 2.16。 ROCm PyTorch 支援現在還包括對 Autocast 作為自動混合精確度模式的支援。也為 OpenCLX 引入了最佳化的本機框架支援。
ROCm 6.2 進一步為「bitsandbytes」模型量化提供記憶體節省,改進 vLLM 支援並增強 AMD Instinct 加速器的效能調整。在 vLLM 方面,大型語言模型現在有 FP16 和 BF16 精度,並且 Llama 也支援 FP8。還有關於多 GPU 執行的額外工作以及 vLLM 支援的其他改進。//」 |
|
|