LLAMA 4 MLX format

本帖最後由 javacomhk 於 2025-4-8 00:35 編輯

最細個個 LLAMA 4 Scout Q4 都要 60GB,睇怕都要買新嘅 Mac Studio 先行到。



在 Huggingface 的 免費使用
https://huggingface.co/spaces/op ... verick-17B-Research
https://huggingface.co/spaces/openfree/Llama-4-Scout-17B-Research
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊

正想搵就見ching share
thx 順手幫推

TOP

本帖最後由 絕望之黑暗 於 2025-4-8 22:11 編輯


M4 Max 64GB Ram Mac Studio不是夠RAM 跑 LLAMA 4 Scout Q4


跑 llama-4-scout-17b-16e-instruct Q3_K_XL  49.76GB RAM

24.15 tok/sec ,1.65s to first token
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊

TOP

本帖最後由 s84292 於 2025-4-11 00:19 編輯

LLAMA 4 我見我平時付費個CLOUD平台上左,試左兩下⋯⋯
就算係滿血Llama 4 Maverick效果唔係咁好,最後都係用返
gemini FLASH 同V3

唔怪得有人話佢跑分作弊

TOP