AMD顯卡可以本地玩DeepSeek了!附簡單部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊塗,國內外的相關企業都在積極適配支持,而對於ai大模型來說,使用gpu運行無疑是最高效的,比如amd,無論是instinct加速卡還是radeon遊戲卡,都已經適配到位。

你只需要任意一塊amd rx 7000系列顯卡,就可以在本地體驗deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

amd radeon遊戲卡本地部署deepseek非常簡單,只需打開amd官網(中英文均可),搜索「15.1.1」,進入第一個結果,下載amd adrenalin 25.1.1測試版驅動,安裝並重啟。

直接下載地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後打開lm studio官網網站的銳龍專欄(https://lmstudio.ai/ryzenai),並下載lm studio for ryzen ai安裝包,安裝並運行。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

啟動之後,點擊右下角設置(可選中文語言),找到並開啟「use lm studio's hugging face」這個選項。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

回到主界面,在左側菜單欄點擊搜索圖標,輸入「deepseek r1」,就可以看到已經訓練好的各種deepseek模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

至於如何選擇,可以參考如下的amd官方推薦列表,比如旗艦級的rx 7900 xtx可以支持到32b參數,主流的rx 7600則僅支持8g模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後下載合適的模型,在主界面上方選擇已下載的模型,然後調高「gpu offload」的數值,不同選項的具體含義可自行搜索或者直接詢問deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

模型載入完畢後,就可以盡情地在本地體驗deepseek了。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

與此同時,amd instinct gpu加速卡也已經部署集成deepseek v3模型,並優化了sglang性能,支持完整的671b參數,開發者可以藉助amd rocm平台快速、高效地開發ai應用。

1、啟動docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、開始使用

(1)、使用cli登陸進入hugging face。

huggingface-cli login 

(2)、啟動sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、伺服器啟動後,打開新的終端,發送請求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基準測試

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行轉換:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

科技分類資訊推薦

剛剛,雷軍宣布大消息! - 天天要聞

剛剛,雷軍宣布大消息!

3月18日晚,小米集團發布2024年財報,小米集團董事長雷軍稱之為「史上最強年報」。財報顯示,2024年小米集團總收入同比增長35%至3659億元(人民幣,以下未特別註明處,俱為人民幣);經調整,凈利潤達272億元,同比增長41.3%,創史上最強業績。其中,2024年第四季度,小米單季營收首次破千億元,達1090億元,同比增長48.8%...
「彩虹集團新突破」告別蚊蟲困擾,許量·彩虹智能生態捕蚊機重磅上市! - 天天要聞

「彩虹集團新突破」告別蚊蟲困擾,許量·彩虹智能生態捕蚊機重磅上市!

重磅新品彩虹集團與許量科技強強聯合,傾力打造許量·彩虹智能生態捕蚊機, 以科技之力,改善蚊媒疾病,守護人類健康!許量科技根據蚊子的習性,結合自有專利DAC技術,充分利用地球大氣環境中均勻分布的二氧化碳氣體與仿生技術相融合,聯合彩虹集團研製出許量·彩虹智能生態捕蚊機。捕蚊機系統循環捕獲並富集自然空氣中的二...
華為Pura新品還有這些新特性!華為何剛視頻透露重磅賣點 - 天天要聞

華為Pura新品還有這些新特性!華為何剛視頻透露重磅賣點

3 月 13 日,華為終端正式宣布:華為 Pura 先鋒盛典及鴻蒙智行新品發布會將於 2025 年 3 月 20 日 14:30 舉行。在官宣之際,華為終端同步推出了一條充滿懸念的預告視頻,視頻中出現「1610 大開想像」的神秘字樣。畫面里,一群年輕人在泳池邊嬉戲,其中一人在游泳時發現泳池內壁可以推動,於是眾人合力推動,將泳池面積擴大...
美的首款人形機器人亮相  美的副總稱「正在推家電機器人化」 - 天天要聞

美的首款人形機器人亮相  美的副總稱「正在推家電機器人化」

記者 張銳 3月18日,美的集團(000333.SZ)發布首款人形機器人引起市場關注。美的集團副總裁兼CTO衛昶受訪表示,公司中央研究院已成立人形機器人創新中心,近期在人形機器人的核心零部件,包括減速機、感測器、控制器等方面取得較好的研究進展。他稱,人形機器人的研發受益於美的集團旗下工業機器人製造公司庫卡集團(KUKA...
太猛了!176萬+6000mAh+144Hz,vivo售價跌至1497元 - 天天要聞

太猛了!176萬+6000mAh+144Hz,vivo售價跌至1497元

在手機圈裡,千元市場就像武林大會的比武擂台,誰能在有限的預算內,打出王者的風采,誰就能贏得「真香」之名。而如今,江湖上有三位猛將橫空出世,號稱「千元三巨頭」:紅米Turbo 3、真我GT Neo6,以及我們這次的主角iQOO Z9 Turb
當特斯拉走下神壇 - 天天要聞

當特斯拉走下神壇

隨著眾多競爭對手脫穎而出,特斯拉所面臨的困境,不僅僅在國內。 2025年春天,特斯拉以連續七周股價暴跌,市值蒸發超8000億美元的慘烈姿態,宣告了其全球霸主地位的動搖。 這場特斯....
光峰科技ALPD影院光源安裝量再創新高,引領全球影院放映變革 - 天天要聞

光峰科技ALPD影院光源安裝量再創新高,引領全球影院放映變革

光峰科技(688007.SH)旗下子公司中影光峰在激光放映領域的市場拓展再次取得重大突破。截至今年2月,中影光峰ALPD激光放映光源在國內的安裝量已成功突破3.1萬套,全球安裝量更是達到了4萬套這一驚人數字。這一里程碑式的成就,不僅彰顯了光峰科技在激光顯示行業的領軍地位,更標誌著中影光峰將全球影院顯示技術帶入了一個全...