AMD顯卡可以本地玩DeepSeek了!附簡單部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊塗,國內外的相關企業都在積極適配支持,而對於ai大模型來說,使用gpu運行無疑是最高效的,比如amd,無論是instinct加速卡還是radeon遊戲卡,都已經適配到位。

你只需要任意一塊amd rx 7000系列顯卡,就可以在本地體驗deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

amd radeon遊戲卡本地部署deepseek非常簡單,只需打開amd官網(中英文均可),搜索「15.1.1」,進入第一個結果,下載amd adrenalin 25.1.1測試版驅動,安裝並重啟。

直接下載地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後打開lm studio官網網站的銳龍專欄(https://lmstudio.ai/ryzenai),並下載lm studio for ryzen ai安裝包,安裝並運行。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

啟動之後,點擊右下角設置(可選中文語言),找到並開啟「use lm studio's hugging face」這個選項。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

回到主界面,在左側菜單欄點擊搜索圖標,輸入「deepseek r1」,就可以看到已經訓練好的各種deepseek模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

至於如何選擇,可以參考如下的amd官方推薦列表,比如旗艦級的rx 7900 xtx可以支持到32b參數,主流的rx 7600則僅支持8g模型。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

然後下載合適的模型,在主界面上方選擇已下載的模型,然後調高「gpu offload」的數值,不同選項的具體含義可自行搜索或者直接詢問deepseek。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

模型加載完畢後,就可以盡情地在本地體驗deepseek了。

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

與此同時,amd instinct gpu加速卡也已經部署集成deepseek v3模型,並優化了sglang性能,支持完整的671b參數,開發者可以藉助amd rocm平台快速、高效地開發ai應用。

1、啟動docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、開始使用

(1)、使用cli登陸進入hugging face。

huggingface-cli login 

(2)、啟動sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、服務器啟動後,打開新的終端,發送請求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基準測試

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行轉換:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD顯卡可以本地玩DeepSeek了!附簡單部署教程 - 天天要聞

科技分類資訊推薦

無線信號增強秘籍,橋接和中繼模式哪個更強? - 天天要聞

無線信號增強秘籍,橋接和中繼模式哪個更強?

【ZOL中關村在線原創技術解析】隨着無線通信與計算機技術飛速發展,人們愈發渴望隨時隨地享受穩定的數據通信服務。無線路由器作為無線網絡核心設備,作用關鍵。但當其信號覆蓋不足,如穿過兩堵牆後信號微弱時,可通過無線橋接或中繼模式連接兩個無線路由器,擴展網絡、增強信號。中繼模式和橋接模式雖都能擴展網絡覆蓋,但...
流暢更耐用 魅族Note 16將預裝Flyme 12 - 天天要聞

流暢更耐用 魅族Note 16將預裝Flyme 12

魅族官方透露,將於5月發佈的魅族Note 16系列將出廠預裝Flyme 12新系統,這也是Flyme系統大版本首次在非旗艦機型上首發。魅族Note 16搭載紫光展銳T765處理器,配備6.78英寸LCD屏,分辨率達2460*1080。後置採用八邊形相機模組,由5000萬像素主攝和200萬像素鏡頭組成。續航方面,內置6600mAh大容量電池,支持40W有線充電
跨境電商迎「成本地震」,行業洗牌加速 - 天天要聞

跨境電商迎「成本地震」,行業洗牌加速

【環球網財經綜合報道】近日,美國正式終止了對中國價值不超過800美元的小額包裹免徵關稅的政策,這一變化引發了中國跨境電商行業的連鎖反應。多家物流公司隨即調整策略,物流費用普遍上漲,並增加了高額預收稅金。(圖片來源:東方IC)美國的800美元小額免稅政策(De Minimis)自2016年實施以來,極大地推動了全球跨境電商...
音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明 - 天天要聞

音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明

5月4日,太湖灣音樂節組委會「關於5月1日太湖灣音樂節的相關討論」,聯合羅雲熙工作室、周深工作室作出如下說明:在演出過程中,現場因節奏調整產生變化,相關團隊均已積極協作,確保了整體流程順利完成。對於由此引發的相關關注,我們充分理解大家的關心
國外一公司推出「空中單車」:可垂直起飛、極速200公里/時 - 天天要聞

國外一公司推出「空中單車」:可垂直起飛、極速200公里/時

快科技5月5日消息,近日,國外一家名為Volonaut的新成立公司推出了一款 「空中單車」,這是一款具有創新性和顛覆性的飛行載具。其由Jetson One(註:一款飛行器)創造者托馬斯・帕坦(Tomasz Patan)在波蘭研發,其設計靈感源自科幻電影,尤其是《星球大戰》中的飛行摩托。外觀上沒有傳統飛行器的冗餘結構,僅見容納推進...
全球首款雙形態人形機械人正式發佈! - 天天要聞

全球首款雙形態人形機械人正式發佈!

前言首次定義具身人形機械人商用範式。近日消息,全球首款雙形態人形機械人——數字華夏IP系列開山之作星行俠P01正式發佈。顏值高、智商高、易使用首次定義具身人形機械人商用範式據悉,數字華夏推出IP系列的初衷,是打造屬於這個時代的「商用機械人」。「外形潮流時尚、智商情商兼具、使用維護極簡,首次定義具身人形機...
三星One UI 8測試版或下月推出 給後續修復留出時間 - 天天要聞

三星One UI 8測試版或下月推出 給後續修復留出時間

【CNMO科技消息】三星已經開始內部測試全新的One UI 8系統,同時也在包括Galaxy Z Flip6在內的多款設備上進行適配測試。按照目前的進度來看,這次更新的到來時間可能比很多人預想得更早,有可能會在今年7月或8月之前就正式推出。 和以往一樣,三星應該會先上線One UI 8的測試版計劃,給部分用戶提前嘗鮮的機會。根據最新消...
蘋果引入Anthropic開發的Claude AI系統 欲放棄自研? - 天天要聞

蘋果引入Anthropic開發的Claude AI系統 欲放棄自研?

【CNMO科技消息】蘋果最近開始引入Anthropic公司開發的Claude AI系統,用於協助其工程師更高效地編寫代碼。 長期以來,蘋果一直堅持自主研發核心技術,很少依賴外部力量。但這一次,它選擇與Anthropic合作,將後者的Claude Sonnet模型集成到自家開發工具Xcode的升級版本中。據彭博社報道,這項合作已經開始在內部落地,主要...
6 大升級!Apple Watch SE 3 入門款到底有多能打? - 天天要聞

6 大升級!Apple Watch SE 3 入門款到底有多能打?

文 | 路邊同學還有 4 個月,蘋果將推出新一代入門級智能手錶 —— Apple Watch SE 3。這款原計劃在 2024 年發佈的機型,因市場節奏調整延後至今,卻也讓外界對其升級細節有了更充分的爆料空間。