Board logo

標題: LLAMA 4 MLX format [打印本頁]

作者: javacomhk    時間: 2025-4-7 01:20     標題: LLAMA 4 MLX format

本帖最後由 javacomhk 於 2025-4-8 00:35 編輯

最細個個 LLAMA 4 Scout Q4 都要 60GB,睇怕都要買新嘅 Mac Studio 先行到。

[attach]2472722[/attach]

在 Huggingface 的 免費使用
https://huggingface.co/spaces/op ... verick-17B-Research
https://huggingface.co/spaces/openfree/Llama-4-Scout-17B-Research
作者: ckyuen2    時間: 2025-4-8 13:22

正想搵就見ching share
thx 順手幫推
作者: 絕望之黑暗    時間: 2025-4-8 21:06

本帖最後由 絕望之黑暗 於 2025-4-8 22:11 編輯

[attach]2472998[/attach]
M4 Max 64GB Ram Mac Studio不是夠RAM 跑 LLAMA 4 Scout Q4


跑 llama-4-scout-17b-16e-instruct Q3_K_XL  49.76GB RAM

24.15 tok/sec ,1.65s to first token
作者: s84292    時間: 2025-4-11 08:18

本帖最後由 s84292 於 2025-4-11 00:19 編輯

LLAMA 4 我見我平時付費個CLOUD平台上左,試左兩下⋯⋯
就算係滿血Llama 4 Maverick效果唔係咁好,最後都係用返
gemini FLASH 同V3

唔怪得有人話佢跑分作弊





歡迎光臨 電腦領域 HKEPC Hardware (https://h0.hkepc.com/forum/) Powered by Discuz! 7.2