deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 7370|回复: 75

来交流一下显卡的训练速度吧

  [复制链接]

51

主题

1231

帖子

7685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7685
 楼主| 发表于 2022-9-17 19:28:05 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 WinKK 于 2023-9-2 08:33 编辑

我用的是RX6600,8G显存。一直惦记得换显卡,但是,又对不同显卡的训练速度没个谱,就想与大家交流一下。

大家应该都用过自闭2.0模型吧:

不知大家各自的显卡训练速度如何? 能否互通一下?

大家如果参加比较,只要新建一个同参数模型,用BS=4、8、16训练一下,得到每次迭代所用时间即可,感谢大家的分享


目前结果是:

显卡               BS=4         BS=8          BS=16(ms)

RTX409013900k@6.2G 高频DDR5)
                       123            197              316

RTX4090        130            230             345

nvidia A100 PCE版 80G
CPU 志强 Glod 6154 14nm Skylake架构
                                          227            414

RTX3090 Ti     174           285             480


Quadro RTX A6000
/TESLA A40    210          360              660

RTX2080TI        221         376               711

RTX3090(低配CPU)

                       234          406              749
Tesla V100
FHHL-16GB    395          635             1360

tesla p40         410          645           1084  

1080ti             350          640

2060s              422          737


6700XT           440          820          1580

RTX3060                         890

RX6600XT                      983

RX6600           610         1166            2750(models_opt_on_gpu: False)

1660s             572           1400(RG版本)

                                        1800 (models_opt_on_gpu: False)


模型参数

================ Model Summary ================
==                                           ==
==            Model name: ZIBI2.0_SAEHD      ==
==                                           ==
==     Current iteration: 49                 ==
==                                           ==
==-------------- Model Options --------------==
==                                           ==
==            resolution: 256                ==
==             face_type: wf                 ==
==     models_opt_on_gpu: True               ==
==                 archi: df-ud              ==
==               ae_dims: 320                ==
==                e_dims: 88                 ==
==                d_dims: 66                 ==
==           d_mask_dims: 22                 ==
==       masked_training: True              ==
==       eyes_mouth_prio: False              ==
==           uniform_yaw: False              ==
==             adabelief: True               ==
==            lr_dropout: n                  ==
==           random_warp: True               ==
==       true_face_power: 0.0                ==
==      face_style_power: 0.0                ==
==        bg_style_power: 0.0                ==
==               ct_mode: none               ==
==              clipgrad: False              ==
==              pretrain: False              ==
==       autobackup_hour: 0                  ==
== write_preview_history: False              ==
==           target_iter: 0                  ==
==       random_src_flip: False              ==
==       random_dst_flip: True               ==
==            batch_size: 4                  ==
==             gan_power: 0.0                ==
==        gan_patch_size: 32                 ==
==              gan_dims: 16                 ==
==         blur_out_mask: False              ==
==      random_hsv_power: 0.0                ==
==                                           ==
==--------------- Running On ----------------==
==                                           ==
==          Device index: 0                  ==
==                  Name: AMD Radeon RX 6600 ==
==                  VRAM: 6.85GB             ==
==                                           ==
===============================================
Starting. Press "Enter" to stop training and save model.
[14:04:57][#002518][0609ms][1.1536][0.9288]
[14:29:37][#004944][0609ms][0.9149][0.6686]
[14:54:37][#007406][0609ms][0.8456][0.5866]
[15:19:37][#009867][0611ms][0.8003][0.5329]





















评分

参与人数 3贡献 +3 收起 理由
a11290403 + 1 很给力!
Winter + 1 很给力!
thethq + 1 很给力!

查看全部评分

回复

使用道具 举报

5

主题

23

帖子

898

积分

高级丹师

Rank: 5Rank: 5

积分
898
发表于 2023-5-3 15:15:01 | 显示全部楼层
6700XT BS4=440  BS8=820 BS16=1580 BS22=爆显存

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 太棒啦!

查看全部评分

回复 支持 1 反对 0

使用道具 举报

4

主题

44

帖子

306

积分

初级丹师

Rank: 3Rank: 3

积分
306
发表于 2022-10-14 15:09:04 | 显示全部楼层
更新了老哥,同样参数。显卡4090
BS=4 130ms BS=8 230ms BS=16 345ms

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 很给力!

查看全部评分

回复 支持 1 反对 0

使用道具 举报

9

主题

2015

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11233

真我风采勋章万事如意节日勋章

发表于 2022-9-17 21:55:21 | 显示全部楼层
这不是256的模型吗?哪来的320?AE又不是解析度
回复 支持 1 反对 0

使用道具 举报

1

主题

35

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
发表于 2022-9-17 21:02:38 | 显示全部楼层
我也想看看我的3060到底行不行
回复 支持 反对

使用道具 举报

11

主题

391

帖子

3211

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3211
发表于 2022-9-17 21:14:52 | 显示全部楼层
3090ti,BS4时为174MS左右,BS8为285MS左右,BS16为480MS左右浮动
models_opt_on_gpu全为True

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 赞一个!

查看全部评分

回复 支持 反对

使用道具 举报

0

主题

61

帖子

551

积分

高级丹师

Rank: 5Rank: 5

积分
551
发表于 2022-9-18 00:33:57 | 显示全部楼层
是不是模型不一样速度不一样呀
回复 支持 反对

使用道具 举报

51

主题

1231

帖子

7685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7685
 楼主| 发表于 2022-9-18 06:03:05 | 显示全部楼层
IAW 发表于 2022-9-17 21:14
3090ti,BS4时为174MS左右,BS8为285MS左右,BS16为480MS左右浮动
models_opt_on_gpu全为True ...

看来,3090的速度是6600的4-5倍,而且,模型越大,优势越明显
回复 支持 反对

使用道具 举报

51

主题

1231

帖子

7685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7685
 楼主| 发表于 2022-9-18 06:07:00 | 显示全部楼层
wtxx8888 发表于 2022-9-17 21:55
这不是256的模型吗?哪来的320?AE又不是解析度

我这显卡玩的最大的模型是320,但只能跑BS=4,所以没法胜任。这个256模型还能跑起来,而且许多人都用过这个模型,所以,用的这个256模型做基准来比较。

只是想知道一下不同显卡的训练速度 模型还是简单些方便比较。
回复 支持 反对

使用道具 举报

51

主题

1231

帖子

7685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7685
 楼主| 发表于 2022-9-18 06:09:31 | 显示全部楼层
Han江孤影 发表于 2022-9-17 21:02
我也想看看我的3060到底行不行

你用你的显卡跑一下这模型啊,到时分享一下速度,也好给大家一个参考。新建一个同参数模型跑一下就行,不用真的训练。

我估计3060会比6600快一些,但应该在同一级别的。
回复 支持 反对

使用道具 举报

51

主题

1231

帖子

7685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7685
 楼主| 发表于 2022-9-18 06:15:13 | 显示全部楼层
konamiboy 发表于 2022-9-18 00:33
是不是模型不一样速度不一样呀

是的。而且,同一模型下参数的变化也影响速度。比较就最好用同模型、同参数。
欢迎参加分享
回复 支持 反对

使用道具 举报

2

主题

621

帖子

6300

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6300
发表于 2022-9-18 11:31:26 | 显示全部楼层
WinKK 发表于 2022-9-18 06:03
看来,3090的速度是6600的4-5倍,而且,模型越大,优势越明显

他是3090ti,比3090高一点
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-6-25 14:55 , Processed in 0.093783 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表