Board logo

標題: [教學] 在手機/平板上安裝 DeepSeek R1 [打印本頁]

作者: javacomhk    時間: 2025-2-13 04:02     標題: 在手機/平板上安裝 DeepSeek R1

本帖最後由 javacomhk 於 2025-2-13 04:47 編輯

1. 在iOS App Store 或 Google Play Store 搜尋及下載安裝

PocketPal AI
[attach]2464693[/attach]

2. 選擇右下角 Go to Models

3. 選擇右下角 + 號 及 Add from Hugging Face

4. 搜尋 DeepSeek 及選擇 DeepSeek-R1-Distill-Qwen-1.5B

[attach]2464695[/attach]

5. 選擇下載 DeepSeek-R1-Distill-Qwen-1.5B_Q4_K_M.gguf  1.12GB

"DeepSeek-R1-Distil-Qwen-1.5B_Q4_K_M.gguf" 這個檔案名稱的意思是:

這是一個 GGUF 格式 的模型檔案,它是 DeepSeek-R1 模型得到的一個版本,這個模型是基於 Qwen (通義千問) 1.5B 參數模型進行蒸餾(Distill)得到的,並使用了 4-bit 量化(Q4) 技術進行壓縮,具體使用的量化方法是 K-Quants Medium (K_M) 變體。

Qwen:這通常指的是 Qwen 系列模型,由 阿里巴巴開源的 Qwen (通義千問) 模型家族。這可能表示該模型是基於 Qwen 的架構或技術訓練/蒸餾出來的。

GGUF (GGML Unified Format) 是一種專為高效推理設計的機器學習模型文件格式,主要用於 CPU 和低資源設備及有幾個主要好處:


了解這些資訊可以幫助您根根據了手機/平板內存及容量更好地選擇和使用模型。例如,如果你有新的快啲嘅Android 平板電腦有12GB RAM 可以嘗試用 DeepSeek-R1-Distill-Qwen-7B-IQ3_XS.GGUF, 如果您希望在資源受限的環境中運行模型,Q4 量化版本會比未量化的版本更合適。而 "K_M" 則表示這個量化版本在性能和大小之間做出了較好的平衡。  知道模型是基於 Qwen 系列的,也有助於您了解模型的特性和能力範圍。

[attach]2464696[/attach]

6. 下載完成後,Load model 試玩
作者: 298268    時間: 2025-2-13 15:03

ha looks fun and downloaded, will give a trial on QWEN2.5 / DeepS 1.5B uncen.  Tks man!
作者: javacomhk    時間: 2025-2-14 15:44

1.5B 嘅 uncensored 係問唔到的乜嘢出來嘅!
作者: ckyuen2    時間: 2025-2-19 08:23

1.5B 無直接出錯已經完成任務
作者: hkocx    時間: 2025-2-19 15:46

用黎計數都有時會重覆reasoning

via HKEPC IR 5.1.14 - iOS(5.1.1F)
作者: javacomhk    時間: 2025-2-19 16:09

用黎計數都有時會重覆reasoning

via HKEPC IR 5.1.14 - iOS(5.1.1F)
hkocx 發表於 2025-2-19 07:46



    所以要用7B model





歡迎光臨 電腦領域 HKEPC Hardware (https://h0.hkepc.com/forum/) Powered by Discuz! 7.2