AMD顯卡可以本地玩DeepSeek了!附簡單部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊塗,國內外的相關企業都在積極適配支持,而對於ai大模型來說,使用gpu運行無疑是最高效的,比如amd,無論是instinct加速卡還是radeon遊戲卡,都已經適配到位。

你只需要任意一塊amd rx 7000系列顯卡,就可以在本地體驗deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

amd radeon遊戲卡本地部署deepseek非常簡單,只需打開amd官網(中英文均可),搜索「15.1.1」,進入第一個結果,下載amd adrenalin 25.1.1測試版驅動,安裝並重啟。

直接下載地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後打開lm studio官網網站的銳龍專欄(https://lmstudio.ai/ryzenai),並下載lm studio for ryzen ai安裝包,安裝並運行。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

啟動之後,點擊右下角設置(可選中文語言),找到並開啟「use lm studio's hugging face」這個選項。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

回到主界面,在左側菜單欄點擊搜索圖標,輸入「deepseek r1」,就可以看到已經訓練好的各種deepseek模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

至於如何選擇,可以參考如下的amd官方推薦列表,比如旗艦級的rx 7900 xtx可以支持到32b參數,主流的rx 7600則僅支持8g模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後下載合適的模型,在主界面上方選擇已下載的模型,然後調高「gpu offload」的數值,不同選項的具體含義可自行搜索或者直接詢問deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

模型載入完畢後,就可以盡情地在本地體驗deepseek了。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

與此同時,amd instinct gpu加速卡也已經部署集成deepseek v3模型,並優化了sglang性能,支持完整的671b參數,開發者可以藉助amd rocm平台快速、高效地開發ai應用。

1、啟動docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、開始使用

(1)、使用cli登陸進入hugging face。

huggingface-cli login 

(2)、啟動sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、伺服器啟動後,打開新的終端,發送請求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基準測試

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行轉換:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

科技分類資訊推薦

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊 - 天天要聞

iPhone一鍵降溫?蘋果這隱藏模式有點過分啊

為了解決發熱這亘古難題,手機廠商絞盡腦汁,往手機里塞散熱膜、均熱板、填充硅脂,甚至還用上了主動風扇。 但到了夏天三四十度的室外,該發熱還是發熱,該燙手還是燙手。 國產安卓如此。 ....
三星Galaxy S26Ultra不裝了,性能太炸裂了! - 天天要聞

三星Galaxy S26Ultra不裝了,性能太炸裂了!

三星Galaxy S26 Ultra即將亮相,帶來多方面升級。·該機型將採用6.9英寸QHD+LTPO AMOLED顯示屏,支持120Hz自適應刷新率和3000尼特峰值亮度,確保在各種光照條件下都能提供清晰的視覺體驗。
中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研 - 天天要聞

中集洋山集裝箱第三季度訂單飽滿 開拓氫能集成裝備求新|公司調研

財聯社7月5日訊(記者 胡皓瓊)中美關稅緩和之下,外貿企業對美出貨恢復,帶動中集洋山集裝箱製造訂單增長。集裝箱製造廠在提升自動化水平的同時,為提高自身抗風險能力,還正布局新賽道。財聯社記者近日走訪中集集團(000039.SZ)旗下中集洋山,眼見一片片鋼板,經歷衝壓、焊接組裝、打砂等一道道工序,逐漸成形。產線上布...
數據寶一體機實機首秀2025生態文明貴陽國際論壇 - 天天要聞

數據寶一體機實機首秀2025生態文明貴陽國際論壇

7月5日至6日,2025年生態文明貴陽國際論壇召開,數據寶攜其AI技術領先成果重磅亮相論壇人工智慧展區,並以「企業私域業務模型一體機」實機首秀,現場演繹數據資產與AI深度賦能綠色發展的創新融合實踐。數據寶「企業私域業務模型一體機」。
登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了 - 天天要聞

登上C909樣機,聽聽中國商飛工程總師怎麼說?《明青講習所》又上新了

名師金課《明青講習所》今又上新,這期節目《「科學家精神」的迴響》聚焦於「科學家精神的時代傳承」,定於7月5日(周六)19:30 在上海教育電視台首播。陳明青老師帶領華東師範大學第一附屬中學、上海市魯迅中學、上海南湖職業技術學院的學生們,踏上沉浸式學習之旅,走進錢學森圖書館、中國商飛上海飛機設計研究院、上海科...