Rank: 3 Rank: 3 Rank: 3

1^# 跳轉到 » 倒序看帖

字體大小: tT

發表於 2025-1-7 01:03 | 只看該作者

[電腦組合] AI computer config/acceleration card

本帖最後由 raywan 於 2025-1-6 17:11 編輯

想請問下有無人玩/自己屋企host AI server比自己用?
近排因為工作需要,經常要用AI model問/答問題,於是用家中電腦/laptop行一的比較簡單AI model,大部份小型AI model回答速度都好快/好滿意, AI model大約是3~8b token,當轉用比較大型AI model 30b~80b以上AI model,回答速度等同一個90歲老人家一樣,答一篇文章大約要5~10分鐘,可能我部電腦config比較差,5600x, 80GB ram,RTX3050 8GB vram...
想請問下大家除左增加CUDA數量/換RTX 4090以上display card之外,有咩方法可以直接加速AI 生成速度?
打算換9950x 192GB ram,display card,display card考慮轉用radeon display,問過AI model話AMD ROCm 等同CUDA加速效果....
有無其他師兄玩過display card以外AI model accelerator e.g Halio,TPU......
我主要想試下不同AI model相同問題,會有不同方法/技巧回答方式,所以我唔會比錢POE之類買AI service達到相同目的,主要想run下不同ai model學習回答技巧/增長知識
我試過相同AI model響不同cpu上跑,32核的確比16核要快,有沒有cuda display card加速對於小ai model的確有大幫助,但對於超大型ai model >100b token model cuda不算是線性加速,可能個model本身對cuda無做優化,我感覺唔到cuda對超大型ai model有強大加速,y還有,有些ai model 永遠都用唔盡cpu和CUDA 做運算,就算個model 一直運行緊,cpu同cuda都只係load緊一半power做運算,浪費時間同電力去完成一個無優化AI運算,所以先考慮另類ai accelerator

0

0

性情中人@yahoo

進階會員

Rank: 3 Rank: 3 Rank: 3

2^#

發表於 2025-1-7 09:58 | 只看該作者

你似係要做 research 咁去玩個 AI，咁會唔會諗下用返啲真係用黎做 AI 既野？
https://www.nvidia.com/en-in/ai-data-science/workstations/

TOP

vinsai

進階會員

Rank: 3 Rank: 3 Rank: 3

3^#

發表於 2025-1-7 10:06 | 只看該作者

本帖最後由 vinsai 於 2025-1-7 10:07 編輯

加cpu ram冇用
要買多vram GPU
暫時呢張平
NVIDIA L20 GPU PCIe 48GB ~$35K

TOP

ppkkkp

中級會員

Rank: 2 Rank: 2

4^#

發表於 2025-1-8 20:21 | 只看該作者

加cpu ram冇用
要買多vram GPU
暫時呢張平
NVIDIA L20 GPU PCIe 48GB ~$35K
vinsai 發表於 2025-1-7 10:06

呢張無風扇，RTX a6000好啲

TOP

ppkkkp

中級會員

Rank: 2 Rank: 2

5^#

發表於 2025-1-8 21:31 | 只看該作者

你個問題唔係cuda唔夠，係vram唔夠搞到GPU要用cpu既ram所以慢左好多，而70b model最少要35GB vram, 所以nvidia單卡應該除左a6000就無其他選擇，之後就係2x4090/3090, 你可以參考下面既網
https://github.com/XiongjieDai/GPU-Benchmarks-on-LLM-Inference
https://blog.hjc.im/apple-uma-for-llms-problems.html

TOP

vinsai

進階會員

Rank: 3 Rank: 3 Rank: 3

6^#

發表於 2025-1-9 08:57 | 只看該作者

呢張無風扇，RTX a6000好啲
ppkkkp 發表於 2025-1-8 20:21

Release Date
A6000 Oct 2020
L20 Nov 2023

CUDA cores
A6000 10752
L20 11776

A6000 點樣好D

TOP

ppkkkp

中級會員

Rank: 2 Rank: 2

7^#

發表於 2025-1-9 23:47 | 只看該作者

Release Date
A6000 Oct 2020
L20 Nov 2023

CUDA cores
A6000 10752
L20 11776

A6000 點樣好D ...
vinsai 發表於 2025-1-9 08:57

無散熱風扇，要自己DIY散熱

TOP

Q-Q 發短消息加為好友 Q-Q 當前離線 UID 358126 帖子 15324 精華 0 積分 1158 EPC Dollar 1158 註冊時間 2020-10-16 最後登錄 2025-1-20 Banned to Post	8^# 發表於 2025-1-20 11:11 \| 只看該作者帳號異常, 請聯絡管理員或版主查詢. 提示: 作者被禁止或刪除內容自動屏蔽

	TOP

s84292

特級會員

Rank: 4 Rank: 4 Rank: 4 Rank: 4

9^#

發表於 2025-1-20 11:16 | 只看該作者

本帖最後由 s84292 於 2025-1-20 05:38 編輯

想請問下有無人玩/自己屋企host AI server比自己用?
近排因為工作需要,經常要用AI model問/答問題,於是用家 ...
raywan 發表於 2025-1-6 17:03

認真，去買部MAC MINI
M4PRO加到64GB RAM ，乜都唔洗升級

或者等NV 部新機仔

但唔打算訓練，純行大模型，都係比月費好過
試唔同模型一樣有CLOUD 服務可以買

另外我諗唔到買AMD 卡做AI的理由
大模型要快NV，要平 APPLE
(APPLE加RAM雖然貴，但佢可以當VRAM用，
NV超過24GB VRAM,唔係1500蚊16GB⋯⋯係每16GB 15000，mini pro 64GB 教育價先14000）

AMD卡除左超算真係冇乜人會AMD消費卡玩AI
（7000系的AI加速器有個花名叫電阻，因為冇用⋯⋯連AMD FSR4都唔支持用7系的AI加速器），
少人用你要搵資料同CONF少好多參考

TOP

raylee

進階會員

Rank: 3 Rank: 3 Rank: 3

10^#

發表於 2025-1-23 14:31 | 只看該作者

想請問下有無人玩/自己屋企host AI server比自己用?
近排因為工作需要,經常要用AI model問/答問題,於是用家 ...
raywan 發表於 2025-1-7 01:03

Wait Nvidia gb10 supercomputer 2025-5 usd3k

TOP

[電腦組合] AI computer config/acceleration card

帳號異常, 請聯絡管理員或版主查詢.

[收藏此主題] [關注此主題的新回覆]

[通過 QQ、MSN 分享給朋友]