AMD顯卡可以本地玩DeepSeek了!附簡單部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊塗,國內外的相關企業都在積極適配支持,而對於ai大模型來說,使用gpu運行無疑是最高效的,比如amd,無論是instinct加速卡還是radeon遊戲卡,都已經適配到位。

你只需要任意一塊amd rx 7000系列顯卡,就可以在本地體驗deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

amd radeon遊戲卡本地部署deepseek非常簡單,只需打開amd官網(中英文均可),搜索“15.1.1”,進入第一個結果,下載amd adrenalin 25.1.1測試版驅動,安裝並重啟。

直接下載地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後打開lm studio官網網站的銳龍專欄(https://lmstudio.ai/ryzenai),並下載lm studio for ryzen ai安裝包,安裝並運行。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

啟動之後,點擊右下角設置(可選中文語言),找到並開啟“use lm studio's hugging face”這個選項。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

回到主界面,在左側菜單欄點擊搜索圖標,輸入“deepseek r1”,就可以看到已經訓練好的各種deepseek模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

至於如何選擇,可以參考如下的amd官方推薦列表,比如旗艦級的rx 7900 xtx可以支持到32b參數,主流的rx 7600則僅支持8g模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後下載合適的模型,在主界面上方選擇已下載的模型,然後調高“gpu offload”的數值,不同選項的具體含義可自行搜索或者直接詢問deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

模型加載完畢後,就可以盡情地在本地體驗deepseek了。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

與此同時,amd instinct gpu加速卡也已經部署集成deepseek v3模型,並優化了sglang性能,支持完整的671b參數,開發者可以藉助amd rocm平台快速、高效地開發ai應用。

1、啟動docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、開始使用

(1)、使用cli登陸進入hugging face。

huggingface-cli login 

(2)、啟動sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、服務器啟動後,打開新的終端,發送請求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基準測試

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行轉換:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

科技分類資訊推薦

全力服務科技創新,上海各家金融機構表態了 - 天天要聞

全力服務科技創新,上海各家金融機構表態了

4月29日,習近平總書記在上海考察時強調,上海承擔著建設國際科技創新中心的歷史使命,要搶抓機遇,以服務國家戰略為牽引,不斷增強科技創新策源功能和高端產業引領功能,加快建成具有全球影響力的科技創新高地。習近平總書記重要講話精神在上海金融界引發強烈反響,令正在奮力做好科技金融大文章的上海金融人倍感振奮、深...
突發,華為nova14這次要降維打擊! - 天天要聞

突發,華為nova14這次要降維打擊!

時間已經來到5月份了,距離上一代華為nova13系列的發布,已經過去7個月了。按照目前華為新機的發布排期,也輪到華為nova新機的發布了。而且,這次華為nova14系列的硬件配置很高,據稱將要降維打擊。根據渠道消息顯示,華為已經正在準備這個
年薪3.63億元!黃仁勛,基本工資10年來首漲 - 天天要聞

年薪3.63億元!黃仁勛,基本工資10年來首漲

據新浪財經報道,根據英偉達於當地時間5月1日遞交給美國證交所(SEC)的一份新文件顯示,黃仁勛2025財年的基本年薪漲至150萬美元,較2024財年增長了49%。他的可變現金也比2024財年增加了100萬美元,增幅為50%。
哪吒汽車App被曝斷網!官網已無法訪問 - 天天要聞

哪吒汽車App被曝斷網!官網已無法訪問

5月4日,哪吒汽車再次被曝出App斷網的問題,相關話題也迅速登上抖音、微博等平台熱搜。據多位哪吒車主在社交平台發布的消息,從5月2日開始,不少車主都遇到了哪吒汽車App斷網、App控車無法使用等問題。
360雲盤使用教程:存儲與同步文件更便捷 - 天天要聞

360雲盤使用教程:存儲與同步文件更便捷

初次使用360雲盤的用戶可能會感到困惑,不清楚如何操作。下面我來介紹其使用方法。360雲盤有多個版本,今天主要講解客戶端的使用,其他版本與此類似。掌握客戶端的用法後,其餘版本也就容易理解了。1、 首先,打開瀏覽器,在地址欄輸入360雲盤客戶端,然後進行搜索。2、 第二步,選擇下載PC版,以好搜為例,其他軟件操作類...
Win7文件夾加密軟件:保護您的隱私和重要文件 - 天天要聞

Win7文件夾加密軟件:保護您的隱私和重要文件

我的電腦長期使用Win7系統,我對其情有獨鍾。有次朋友問起,是否知道Win7文件夾加密軟件?這類軟件確實存在,今天就來為大家詳細介紹這款實用工具的功能與特點。1、 下載安裝win7文件夾加密軟件十分簡便,只需輕點一下即可開始安裝。2、 接着,我打開了軟件中的加密文件。3、 選中我們的win7文件夾即可。4、 護密軟件會彈出...
保障隱私:免費文件夾加密軟件推薦 - 天天要聞

保障隱私:免費文件夾加密軟件推薦

網上有許多免費的文件夾加密軟件,但並非都好用。這裡介紹一款實用的免費工具,值得一試。1、 讓我們下載免費的文件夾加密軟件來保護隱私。2、 安裝完成後,運行軟件並點擊加密文件夾。3、 選擇一個需要加密的文件夾,例如名為工作重要內容的文件夾。4、 為文件夾設置密碼後,採用閃電加密方式保護。5、 軟件開始快速加密,...
文件夾加密軟件使用指南 - 天天要聞

文件夾加密軟件使用指南

想給保密文件加密卻不知如何操作?其實很簡單,只需下載文件夾加密軟件。下面小編就為大家講解如何使用該軟件進行文件加密。1、 首先,從百度搜索易捷文件夾加密軟件,進入任意網頁下載安裝,這一步不再詳述,相信大家都懂。2、 點擊後會出現一個選擇文件夾的窗口,我們需要選擇文件夾,並記得文件夾的存放位置,否則怎麼找...