AMD显卡可以本地玩DeepSeek了!附简单部署教程

2025年02月09日19:10:41 科技 5684

快科技2月9日消息,deepseek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于ai大模型来说,使用gpu运行无疑是最高效的,比如amd,无论是instinct加速卡还是radeon游戏卡,都已经适配到位。

你只需要任意一块amd rx 7000系列显卡,就可以在本地体验deepseek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

amd radeon游戏卡本地部署deepseek非常简单,只需打开amd官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载amd adrenalin 25.1.1测试版驱动,安装并重启。

直接下载地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/rn-rad-win-25-1-1.html

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

然后打开lm studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载lm studio for ryzen ai安装包,安装并运行。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

启动之后,点击右下角设置(可选中文语言),找到并开启“use lm studio's hugging face”这个选项。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

回到主界面,在左侧菜单栏点击搜索图标,输入“deepseek r1”,就可以看到已经训练好的各种deepseek模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

至于如何选择,可以参考如下的amd官方推荐列表,比如旗舰级的rx 7900 xtx可以支持到32b参数,主流的rx 7600则仅支持8g模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“gpu offload”的数值,不同选项的具体含义可自行搜索或者直接询问deepseek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

模型加载完毕后,就可以尽情地在本地体验deepseek了。

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

与此同时,amd instinct gpu加速卡也已经部署集成deepseek v3模型,并优化了sglang性能,支持完整的671b参数,开发者可以借助amd rocm平台快速、高效地开发ai应用。

1、启动docker容器

docker run -it --ipc=host --cap-add=sys_ptrace --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、开始使用

(1)、使用cli登陆进入hugging face。

huggingface-cli login 

(2)、启动sglang server,在本地部署deepseekv3 fp8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/deepseek-v3 --port 30000 --tp 8 --trust-remote-code

(3)、服务器启动后,打开新的终端,发送请求。

curl http://localhost:30000/generate \

 -h "content-type: application/json" \

 -d '{

  "text": "once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基准测试

export hsa_no_scratch_reclaim=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/deepseek-v3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

accuracy: 0.952

invalid: 0.000

另外,如果需要bf16精度,可以自行转换:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD显卡可以本地玩DeepSeek了!附简单部署教程 - 天天要闻

科技分类资讯推荐

无线信号增强秘籍,桥接和中继模式哪个更强? - 天天要闻

无线信号增强秘籍,桥接和中继模式哪个更强?

【ZOL中关村在线原创技术解析】随着无线通信与计算机技术飞速发展,人们愈发渴望随时随地享受稳定的数据通信服务。无线路由器作为无线网络核心设备,作用关键。但当其信号覆盖不足,如穿过两堵墙后信号微弱时,可通过无线桥接或中继模式连接两个无线路由器,扩展网络、增强信号。中继模式和桥接模式虽都能扩展网络覆盖,但...
流畅更耐用 魅族Note 16将预装Flyme 12 - 天天要闻

流畅更耐用 魅族Note 16将预装Flyme 12

魅族官方透露,将于5月发布的魅族Note 16系列将出厂预装Flyme 12新系统,这也是Flyme系统大版本首次在非旗舰机型上首发。魅族Note 16搭载紫光展锐T765处理器,配备6.78英寸LCD屏,分辨率达2460*1080。后置采用八边形相机模组,由5000万像素主摄和200万像素镜头组成。续航方面,内置6600mAh大容量电池,支持40W有线充电
跨境电商迎“成本地震”,行业洗牌加速 - 天天要闻

跨境电商迎“成本地震”,行业洗牌加速

【环球网财经综合报道】近日,美国正式终止了对中国价值不超过800美元的小额包裹免征关税的政策,这一变化引发了中国跨境电商行业的连锁反应。多家物流公司随即调整策略,物流费用普遍上涨,并增加了高额预收税金。(图片来源:东方IC)美国的800美元小额免税政策(De Minimis)自2016年实施以来,极大地推动了全球跨境电商...
音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明 - 天天要闻

音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明

5月4日,太湖湾音乐节组委会“关于5月1日太湖湾音乐节的相关讨论”,联合罗云熙工作室、周深工作室作出如下说明:在演出过程中,现场因节奏调整产生变化,相关团队均已积极协作,确保了整体流程顺利完成。对于由此引发的相关关注,我们充分理解大家的关心
国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时 - 天天要闻

国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时

快科技5月5日消息,近日,国外一家名为Volonaut的新成立公司推出了一款 “空中自行车”,这是一款具有创新性和颠覆性的飞行载具。其由Jetson One(注:一款飞行器)创造者托马斯・帕坦(Tomasz Patan)在波兰研发,其设计灵感源自科幻电影,尤其是《星球大战》中的飞行摩托。外观上没有传统飞行器的冗余结构,仅见容纳推进...
全球首款双形态人形机器人正式发布! - 天天要闻

全球首款双形态人形机器人正式发布!

前言首次定义具身人形机器人商用范式。近日消息,全球首款双形态人形机器人——数字华夏IP系列开山之作星行侠P01正式发布。颜值高、智商高、易使用首次定义具身人形机器人商用范式据悉,数字华夏推出IP系列的初衷,是打造属于这个时代的「商用机器人」。“外形潮流时尚、智商情商兼具、使用维护极简,首次定义具身人形机...
三星One UI 8测试版或下月推出 给后续修复留出时间 - 天天要闻

三星One UI 8测试版或下月推出 给后续修复留出时间

【CNMO科技消息】三星已经开始内部测试全新的One UI 8系统,同时也在包括Galaxy Z Flip6在内的多款设备上进行适配测试。按照目前的进度来看,这次更新的到来时间可能比很多人预想得更早,有可能会在今年7月或8月之前就正式推出。 和以往一样,三星应该会先上线One UI 8的测试版计划,给部分用户提前尝鲜的机会。根据最新消...
苹果引入Anthropic开发的Claude AI系统 欲放弃自研? - 天天要闻

苹果引入Anthropic开发的Claude AI系统 欲放弃自研?

【CNMO科技消息】苹果最近开始引入Anthropic公司开发的Claude AI系统,用于协助其工程师更高效地编写代码。 长期以来,苹果一直坚持自主研发核心技术,很少依赖外部力量。但这一次,它选择与Anthropic合作,将后者的Claude Sonnet模型集成到自家开发工具Xcode的升级版本中。据彭博社报道,这项合作已经开始在内部落地,主要...
6 大升级!Apple Watch SE 3 入门款到底有多能打? - 天天要闻

6 大升级!Apple Watch SE 3 入门款到底有多能打?

文 | 路边同学还有 4 个月,苹果将推出新一代入门级智能手表 —— Apple Watch SE 3。这款原计划在 2024 年发布的机型,因市场节奏调整延后至今,却也让外界对其升级细节有了更充分的爆料空间。