電腦領域 HKEPC Hardware - Powered by Discuz! Board

標題: LLAMA 4 MLX format [打印本頁]

作者: javacomhk 時間: 2025-4-7 01:20 標題: LLAMA 4 MLX format

本帖最後由 javacomhk 於 2025-4-8 00:35 編輯

最細個個 LLAMA 4 Scout Q4 都要 60GB，睇怕都要買新嘅 Mac Studio 先行到。

[attach]2472722[/attach]

在 Huggingface 的免費使用
https://huggingface.co/spaces/op ... verick-17B-Research
https://huggingface.co/spaces/openfree/Llama-4-Scout-17B-Research

作者: ckyuen2 時間: 2025-4-8 13:22

正想搵就見ching share
thx 順手幫推

作者: 絕望之黑暗 時間: 2025-4-8 21:06

本帖最後由絕望之黑暗於 2025-4-8 22:11 編輯

[attach]2472998[/attach]
M4 Max 64GB Ram Mac Studio不是夠RAM 跑 LLAMA 4 Scout Q4

跑 llama-4-scout-17b-16e-instruct Q3_K_XL 49.76GB RAM

24.15 tok/sec ,1.65s to first token

作者: s84292 時間: 2025-4-11 08:18

本帖最後由 s84292 於 2025-4-11 00:19 編輯

LLAMA 4 我見我平時付費個CLOUD平台上左，試左兩下⋯⋯
就算係滿血Llama 4 Maverick效果唔係咁好，最後都係用返
gemini FLASH 同V3

唔怪得有人話佢跑分作弊