deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1214|回复: 9

CPU和内存性能也对训练速度有重大影响!

[复制链接]

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
 楼主| 发表于 2022-10-23 23:01:01 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 zill25 于 2022-10-23 23:46 编辑

最近我的一系列测试证明了这一点

同样一个256wf 320-88-66-22的df-ud模型
在滚石的云平台上的RTX3090 bs=4、8、16 100个迭代平均每次耗时分别为 234ms     406ms     749ms

而我自己的RTX2080Ti bs=4、8、16 100个迭代平均每次耗时分别为 221ms   376ms    711ms

QQ截图20221023223831.png

QQ截图20221023224540.png



众所周知,RTX3090的运算性能要远高于2080Ti,但为什么被2080Ti反超?因为服务器的cpu的单线程性能是比较差的,特别是我选的普通性能的U还是22nm的haswell架构
我2080ti配套的是i9 13900K,超频到全核5.5G,单核最高6.2G,搭配DDR5 6800内存,在这种情况下2080Ti的性能做到了在bs=16下关闭model opt on gpu还比开着这个选项的3090快!

然后我又测试了一下4090,有坛友在搭配R9 5950X+DDR4 3000测试同一模型BS=4、8、16 迭代时间为130   230   345ms
我这个配置用4090测试该模型BS=4  123ms   BS=8  197ms  BS=16 316ms 提升不大,但的确还是要快一些
目前运算速度最快的组合就是超过频的13900K+4090,但由于显存只有24gb,有些高参模型还是不能跑。

屏幕截图 2022-10-23 162141.png


所以我建议大家在云平台,尽量选择显存大的跑,不一点要刻意追求GPU性能,因为反正也会被CPU拖后腿,不如发挥其应有的优势,跑别人卡跑不了的模型!


回复

使用道具 举报

1

主题

21

帖子

413

积分

初级丹师

Rank: 3Rank: 3

积分
413
发表于 2022-10-23 23:23:05 | 显示全部楼层
很有价值的参考,谢谢楼主,实践出真知
回复 支持 反对

使用道具 举报

0

主题

107

帖子

1556

积分

初级丹圣

Rank: 8Rank: 8

积分
1556

万事如意节日勋章

发表于 2022-10-24 01:48:30 | 显示全部楼层
感谢楼主发布有价值的参考
回复 支持 反对

使用道具 举报

59

主题

457

帖子

2731

积分

初级丹圣

Rank: 8Rank: 8

积分
2731
发表于 2022-10-24 02:07:24 | 显示全部楼层
本帖最后由 qiuyuande 于 2022-10-24 03:33 编辑

确实cpu 有一定的影响的
回复 支持 反对

使用道具 举报

50

主题

1223

帖子

8020

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8020
发表于 2022-10-24 06:10:44 | 显示全部楼层
这就是说,不但要换显卡,还要换CPU、内存,就得跟着换主板和电源——除了机箱,都要换了
回复 支持 反对

使用道具 举报

22

主题

615

帖子

4609

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4609
发表于 2022-10-24 07:21:36 | 显示全部楼层
参考学习一下
回复 支持 反对

使用道具 举报

23

主题

268

帖子

1521

积分

初级丹圣

Rank: 8Rank: 8

积分
1521
发表于 2022-10-24 08:57:57 | 显示全部楼层
本帖最后由 cjlzkl 于 2022-10-24 08:59 编辑

所以你看cpu占用了么,看下来感觉你并没有做好变量啊……为啥得出cpu的问题而不是云平台的问腿。我是觉得这两个因素到达门槛后影响基本可以忽略不计。dlf版本优化方式的问题什么都有可能,比如我用原版,玩游戏的时候变成20s一迭代,但是用me版本,基本没影响2s一迭代。前者cpu满载跑的,后者限制了只用一半核心,cpu平时也都是20占用,速度上也差不多,那是不是可以得出结论cpu影响微乎其微了
回复 支持 反对

使用道具 举报

59

主题

457

帖子

2731

积分

初级丹圣

Rank: 8Rank: 8

积分
2731
发表于 2022-10-24 10:32:29 | 显示全部楼层
cjlzkl 发表于 2022-10-24 08:57
所以你看cpu占用了么,看下来感觉你并没有做好变量啊……为啥得出cpu的问题而不是云平台的问腿。我是觉得这 ...

影响还是很大的 就说模型 自动保存数据 CPU更好 可能就10多秒 保持了  有些需要1分多钟。
回复 支持 反对

使用道具 举报

23

主题

268

帖子

1521

积分

初级丹圣

Rank: 8Rank: 8

积分
1521
发表于 2022-10-24 12:27:18 | 显示全部楼层
qiuyuande 发表于 2022-10-24 10:32
影响还是很大的 就说模型 自动保存数据 CPU更好 可能就10多秒 保持了  有些需要1分多钟。 ...

保存肯定是固态影响大啊,我cpu才2700,硬盘m2  , 512   192的丹保存大概5-6秒
回复 支持 反对

使用道具 举报

2

主题

42

帖子

303

积分

初级丹师

Rank: 3Rank: 3

积分
303
发表于 2022-10-30 03:40:44 | 显示全部楼层
感谢分享 最近这段时间也在讨论选择台服务器来做AI,很有实质性的价值,减少了我们自己摸索的时间成本
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-22 19:39 , Processed in 0.101182 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表