deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 343|回复: 8

求问关于使用A卡DX12和N卡CUDA训练速度问题

[复制链接]

3

主题

16

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050
 楼主| 发表于 2024-9-14 01:11:39 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
有A卡N卡都用过的大佬吗
现在我用的是4060Ti16g,288以上分辨率模型ae稍微大点的后期开gan batch_size最多只能开到batch_size:4。
想问的是A卡用DX12训练和N卡CUDA训练速度差距大吗,N卡显存再往上就只能上4090了,现在想购入7900XTX24g显存价格便宜才7k不到
,就是不知道没有CUDA训练速度如何。
还有就是有大佬用过双卡训练吗,双卡训练显存可以叠加吗,就比如我上两张4060ti16g训练的时候是不是就有32g可用了。
回复

使用道具 举报

13

主题

129

帖子

1553

积分

初级丹圣

Rank: 8Rank: 8

积分
1553
发表于 2024-9-14 14:32:38 | 显示全部楼层
本帖最后由 fghfdg 于 2024-9-14 15:00 编辑

我从3070换到现在的7900XTX,确实7900XTX24g显存不到7k,但是A卡只能用DX12或者dml训练。dx12 还好,dml训练的时候batch_size会比dx12的小(你可以翻我A卡显存问题那个贴)。只有原版和神农1.86(包含1.86以前的)是dx12的。神农1.86以后的版本以及猫之汉化新春版都是dml的,A卡能用但是batch_size会比dx12的小(模型越大越明显),ice全部都是CUDA的A卡用不了。如果你能接受以上特点,那A卡还是很有性价比的。
补充一点,7900XTX24g显存和4090在原版上训练速度相差不大(4090大概快15%左右),但是在ice上4090非常快(我看到有人训练的截图,4090显卡在ice上训练一个512-512-96-72-32的模型bs能开14,迭代速度1400ms左右,我7900xtx在原版训练一个384-512-96-80-32的模型bs开8迭代速度1100ms左右)
再补充一点,A卡用1120dx12训练的时候可能会异常卡顿,用0504dx12就没事。0504dx12是英文版的(汉化的翻我帖子,我把猫版1120cuda的汉化弄过去0504dx12了
回复 支持 2 反对 0

使用道具 举报

21

主题

284

帖子

3380

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3380
发表于 2024-9-14 08:50:39 | 显示全部楼层
4090现在停产涨价,价格比首发还要高几千,有没必要当冤种,3090全部是矿卡,也没必要买,4090d现在一万出头,可以接受马上发布50系跌价你就买,a卡不用考虑,可以考虑2080ti魔改的22g版本,价格2000出头
回复 支持 反对

使用道具 举报

15

主题

182

帖子

6766

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6766

万事如意节日勋章

发表于 2024-9-14 12:08:59 | 显示全部楼层
本帖最后由 wzx945 于 2024-9-14 13:46 编辑

我记得论坛里有大佬测试过吧,DFL的话好像显存大小更重要一些,同级别的A卡和N卡训练速度基本没多少差距,但是A卡显存大,在DFL训练时更有优势。
但如果你要玩其他的AI模型,可能还是得上N卡,A卡兼容性始终是个问题,各种魔改版的DFL都会出问题,但只用原版DFL就没事
回复 支持 反对

使用道具 举报

13

主题

406

帖子

2868

积分

初级丹圣

Rank: 8Rank: 8

积分
2868
发表于 2024-9-14 16:55:53 | 显示全部楼层
用内存换显存啊384的ae的模型我16g能跑20bs
回复 支持 反对

使用道具 举报

3

主题

16

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050
 楼主| 发表于 2024-9-15 17:05:48 | 显示全部楼层
htyy 发表于 2024-9-14 16:55
用内存换显存啊384的ae的模型我16g能跑20bs

大佬这个需要怎么操作 有相关的帖子介绍吗
回复 支持 反对

使用道具 举报

3

主题

16

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050
 楼主| 发表于 2024-9-15 17:22:37 | 显示全部楼层
fghfdg 发表于 2024-9-14 14:32
我从3070换到现在的7900XTX,确实7900XTX24g显存不到7k,但是A卡只能用DX12或者dml训练。dx12 还好,dml训 ...

感谢大佬解答,这样开来A卡还是很有性价比
回复 支持 反对

使用道具 举报

13

主题

406

帖子

2868

积分

初级丹圣

Rank: 8Rank: 8

积分
2868
发表于 2024-9-16 18:02:18 | 显示全部楼层
GEMIU0816CC 发表于 2024-9-15 17:05
大佬这个需要怎么操作 有相关的帖子介绍吗

ice版
回复 支持 反对

使用道具 举报

3

主题

105

帖子

2106

积分

初级丹圣

Rank: 8Rank: 8

积分
2106
发表于 2024-11-18 13:45:29 | 显示全部楼层
GEMIU0816CC 发表于 2024-9-15 17:22
感谢大佬解答,这样开来A卡还是很有性价比

2080Ti 22g 跑你的邓紫棋可以 bs20 哦
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-12-4 01:31 , Processed in 0.131700 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表