AMD显卡可以本地玩DeepSeek了!附简单部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于ai大模型来说,使用gpu运行无疑是最高效的,比如amd,无论是instinct加速卡还是radeon游戏卡,都已经适配到位。

你只需要任意一块amd rx 7000系列显卡,就可以在本地体验deepseek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

amd radeon游戏卡本地部署deepseek非常简单,只需打开amd官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载amd adrenalin 25.1.1测试版驱动,安装并重启。

直接下载地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

然后打开lm studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载lm studio for ryzen ai安装包,安装并运行。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

启动之后,点击右下角设置(可选中文语言),找到并开启“use lm studio's hugging face”这个选项。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

回到主界面,在左侧菜单栏点击搜索图标,输入“deepseek r1”,就可以看到已经训练好的各种deepseek模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

至于如何选择,可以参考如下的amd官方推荐列表,比如旗舰级的rx 7900 xtx可以支持到32b参数,主流的rx 7600则仅支持8g模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“gpu offload”的数值,不同选项的具体含义可自行搜索或者直接询问deepseek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

模型加载完毕后,就可以尽情地在本地体验deepseek了。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

与此同时,amd instinct gpu加速卡也已经部署集成deepseek v3模型,并优化了sglang性能,支持完整的671b参数,开发者可以借助amd rocm平台快速、高效地开发ai应用。

1、启动docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、开始使用

(1)、使用cli登陆进入hugging face。

huggingface-cli login 

(2)、启动sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、服务器启动后,打开新的终端,发送请求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基准测试

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行转换:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

科技分类资讯推荐

彻底火了,库存告急!订单已排到半月后 - 天天要闻

彻底火了,库存告急!订单已排到半月后

近期,“充电宝召回” 事件引发广泛关注,3C认证已成为消费者衡量充电宝品质的关键指标,国内部分机场也加强了对充电宝3C标识的查验力度。央视财经记者探访发现,线下市场和电商平台带有3C标识的充电宝产品销量都出现增长。
理发店陷入倒闭潮?不是没客人,也不是电商冲击,是自己作垮了 - 天天要闻

理发店陷入倒闭潮?不是没客人,也不是电商冲击,是自己作垮了

很多人抱怨行业不好,再加上电商冲击,所以经营起来也是相当困难。可是有这么一个行业,电商根本进驻不进来。在这个行业,大家经营全靠本事,谁有能力谁赚钱。但是即便是这样,为了赚块钱,行业内的人还是将这个行业给彻底做臭了。各种各样的套路层出不穷,甚
大疆OSMO 360 完整规格 7月29日发布 - 天天要闻

大疆OSMO 360 完整规格 7月29日发布

对于那些一直在等待大疆 Osmo 360 的人来说,听到在本月底7月29日开售的消息,你们一定会很高兴。今天我偶然发现了这两款产品的完整网店描述和图片已经上线。所以,我们先来深入了解一下那款“革命性 8K” Osmo 360 的描述。
iPhone一键降温?苹果这隐藏模式有点过分啊 - 天天要闻

iPhone一键降温?苹果这隐藏模式有点过分啊

为了解决发热这亘古难题,手机厂商绞尽脑汁,往手机里塞散热膜、均热板、填充硅脂,甚至还用上了主动风扇。 但到了夏天三四十度的室外,该发热还是发热,该烫手还是烫手。 国产安卓如此。 ....
三星Galaxy S26Ultra不装了,性能太炸裂了! - 天天要闻

三星Galaxy S26Ultra不装了,性能太炸裂了!

三星Galaxy S26 Ultra即将亮相,带来多方面升级。·该机型将采用6.9英寸QHD+LTPO AMOLED显示屏,支持120Hz自适应刷新率和3000尼特峰值亮度,确保在各种光照条件下都能提供清晰的视觉体验。
中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研 - 天天要闻

中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研

财联社7月5日讯(记者 胡皓琼)中美关税缓和之下,外贸企业对美出货恢复,带动中集洋山集装箱制造订单增长。集装箱制造厂在提升自动化水平的同时,为提高自身抗风险能力,还正布局新赛道。财联社记者近日走访中集集团(000039.SZ)旗下中集洋山,眼见一片片钢板,经历冲压、焊接组装、打砂等一道道工序,逐渐成形。产线上布...