deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 205|回复: 9

不知道什么原因,A卡跑不起来了

[复制链接]

14

主题

181

帖子

5193

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5193

万事如意节日勋章

 楼主| 发表于 2024-10-2 21:25:51 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
最近一段时间,不知道哪里的设定调错了,现在我训练模型的时候显卡总是跑不起来。



我的显卡是AMD的7900XT,20G显存。模型训练刚开始的时候都是一切正常,但是跑个半小时左右,显卡的功耗就开始下降,在资源管理器里能看见显卡占用率从刚开始的100%左右波动,变成在70%左右波动,再跑一会儿甚至会降到20-30%,时间再长点儿,模型训练就会卡住不动,显卡的显存占用并不会下降,但是显卡本身就不转了。


我检查了虚拟内存,现在的虚拟内存是150-200G,没什么问题。

我试着刷了新旧版本的显卡驱动,但是问题没有解决。

我试着用神农版的DFL(3.06版)来跑,这个倒是可以让显卡全功率运行,不过不知道为什么,这个对显存的占用很高,BS只能4,再高就报错,但是我用原版DFL明明可以BS12来跑。

有没有大佬知道这到底是怎么回事,是哪里的设定调错了吗?

Screenshot 2024-10-02 210953.png
Screenshot 2024-10-02 210943.png
回复

使用道具 举报

14

主题

2849

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15365

真我风采勋章万事如意节日勋章

发表于 2024-10-2 21:32:36 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-10-2 21:37 编辑

A卡要用DX12版本0504,DML版的BS,要比DX12版开的小。
其他DX12版本的,听说会不定期的程序卡死。

A卡有训练问题的进(0504DFLDX12)更新一下这个帖子汉化好了-综合讨论-deepfacelab中文网 - Powered by Discuz! (dfldata.cc)


可以下,我发的新版DX12,今天换成了0504为基础。
20241001 DeepFaceLab_MVEfork_合体版-【DFL】软件下载-deepfacelab中文网 - Powered by Discuz! (dfldata.cc)
回复 支持 反对

使用道具 举报

14

主题

181

帖子

5193

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5193

万事如意节日勋章

 楼主| 发表于 2024-10-2 21:40:43 | 显示全部楼层
wtxx8888 发表于 2024-10-2 21:32
A卡要用DX12版本0504,DML版的BS,要比DX12版开的小。
其他DX12版本的,听说会不定期的程序卡死。

谢谢,我下载试试
回复 支持 反对

使用道具 举报

14

主题

2849

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15365

真我风采勋章万事如意节日勋章

发表于 2024-10-2 21:43:34 | 显示全部楼层
wzx945 发表于 2024-10-2 21:40
谢谢,我下载试试

不客气,我也是今天才知道的。
昨天我用的1120的DX12,然后别的A卡用户告诉我的。
我下午才重发的DX12,改成了0504为基础。
回复 支持 反对

使用道具 举报

4

主题

122

帖子

1713

积分

初级丹圣

Rank: 8Rank: 8

积分
1713
发表于 2024-10-3 08:57:12 | 显示全部楼层
The best amd versions is Shennong for Chinese and DeepAscension for English that use directml instead of trash dx12 for better performance and capability
回复 支持 反对

使用道具 举报

3

主题

192

帖子

2111

积分

初级丹圣

Rank: 8Rank: 8

积分
2111

万事如意节日勋章

发表于 2024-10-9 10:20:56 | 显示全部楼层
wtxx8888 发表于 2024-10-2 21:32
A卡要用DX12版本0504,DML版的BS,要比DX12版开的小。
其他DX12版本的,听说会不定期的程序卡死。

DML不是应该性能比dx12更好吗。怎么会反过来了?
回复 支持 反对

使用道具 举报

14

主题

2849

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15365

真我风采勋章万事如意节日勋章

发表于 2024-10-9 10:22:23 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-10-9 10:42 编辑
百里瑾轩 发表于 2024-10-9 10:20
DML不是应该性能比dx12更好吗。怎么会反过来了?

DML的BS。开的比DX12小,DFL这里,就是DX12强(DX12实际上的代码,也走了部分DML的渠道)。
DFL的老手,A卡几乎都是DX12的,也就新人不知道的,才去用DML(甚至N卡都有用的)。。。
神农3就是DML的,没看到楼主写的,不如原版BS开的高?正经原版只有DX12,魔改的有DML,但一样开的BS要小。
回复 支持 反对

使用道具 举报

3

主题

192

帖子

2111

积分

初级丹圣

Rank: 8Rank: 8

积分
2111

万事如意节日勋章

发表于 2024-10-9 10:58:43 | 显示全部楼层
wtxx8888 发表于 2024-10-9 10:22
DML的BS。开的比DX12小,DFL这里,就是DX12强(DX12实际上的代码,也走了部分DML的渠道)。
DFL的老手,A ...

我sd用dml和dx12是dml强,才发现每个ai软件还不一样。
回复 支持 反对

使用道具 举报

14

主题

2849

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15365

真我风采勋章万事如意节日勋章

发表于 2024-10-9 11:05:07 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-10-9 11:12 编辑
百里瑾轩 发表于 2024-10-9 10:58
我sd用dml和dx12是dml强,才发现每个ai软件还不一样。

反正A卡就是后娘养的。才看过显卡市场,占有率的报道。
N卡占有率百分之88,A卡只有百分之12。英特尔及其他,不足1忽略不计。
A卡不能抗衡CUDA的情况,纯白扯,对于现在的NV,连对手都算不上。。。
以后发展就不清楚了,除非AMD能出,可以跟CUDA抗衡的算法。。。

不然这个市场比率下,没哪个编程的,乐意多搞一套代码,去支持那百分之10几的用户?
所以超多的软件,干脆就不支持A卡

回复 支持 反对

使用道具 举报

3

主题

192

帖子

2111

积分

初级丹圣

Rank: 8Rank: 8

积分
2111

万事如意节日勋章

发表于 2024-10-9 14:39:38 | 显示全部楼层
wtxx8888 发表于 2024-10-9 11:05
反正A卡就是后娘养的。才看过显卡市场,占有率的报道。
N卡占有率百分之88,A卡只有百分之12。英特尔及 ...

我用的3080 20g,好用的很,我只是心疼一下楼主A卡用得这么疼苦罢了
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-10-25 01:21 , Processed in 0.090654 second(s), 10 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表