標題: LLAMA 4 MLX format [打印本頁]
作者: javacomhk 時間: 2025-4-7 01:20 標題: LLAMA 4 MLX format
本帖最後由 javacomhk 於 2025-4-8 00:35 編輯
最細個個 LLAMA 4 Scout Q4 都要 60GB,睇怕都要買新嘅 Mac Studio 先行到。
[attach]2472722[/attach]
在 Huggingface 的 免費使用
https://huggingface.co/spaces/op ... verick-17B-Research
https://huggingface.co/spaces/openfree/Llama-4-Scout-17B-Research
作者: ckyuen2 時間: 2025-4-8 13:22
正想搵就見ching share
thx 順手幫推
作者: 絕望之黑暗 時間: 2025-4-8 21:06
本帖最後由 絕望之黑暗 於 2025-4-8 22:11 編輯
[attach]2472998[/attach]
M4 Max 64GB Ram Mac Studio不是夠RAM 跑 LLAMA 4 Scout Q4
跑 llama-4-scout-17b-16e-instruct Q3_K_XL 49.76GB RAM
24.15 tok/sec ,1.65s to first token
作者: s84292 時間: 2025-4-11 08:18
本帖最後由 s84292 於 2025-4-11 00:19 編輯
LLAMA 4 我見我平時付費個CLOUD平台上左,試左兩下⋯⋯
就算係滿血Llama 4 Maverick效果唔係咁好,最後都係用返
gemini FLASH 同V3
唔怪得有人話佢跑分作弊
