deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: WinKK

来交流一下显卡的训练速度吧

  [复制链接]

19

主题

150

帖子

5418

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5418
发表于 2022-10-21 16:58:40 | 显示全部楼层
WinKK 发表于 2022-10-13 18:54
现在也就能买到4090,这东西个头大,功耗高。电源、机箱都是大问题,换了就相当于全套都换啊 ...

现在4090挖矿有收益就知道 功耗比会比30系低
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-23 16:08:14 | 显示全部楼层
我现在手上有一块4090和2080ti,我的4090是配合i9 13900K,单核心睿频超到6.2G,DDR5 7200,性能应该可以,来试一下时间
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-23 16:17:57 | 显示全部楼层
RTX4090+目前为止单核性能最强的CPU 13900k@6.2G+高频DDR5内存跑这个模型:
BS=4  123ms
BS=8  197ms
BS=16 316ms

由此可以看出,CPU的性能也会对训练速度造成影响
另外4090真的是目前速度最快的GPU,远远领先3090Ti

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 很给力!

查看全部评分

回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-24 05:57:45 | 显示全部楼层
zill25 发表于 2022-10-23 16:17
RTX4090+目前为止单核性能最强的CPU +高频DDR5内存跑这个模型:
BS=4  123ms
BS=8  197ms

这个太快了吧,牛
回复 支持 反对

使用道具 举报

8

主题

74

帖子

692

积分

高级丹师

Rank: 5Rank: 5

积分
692
发表于 2022-10-25 11:04:35 | 显示全部楼层
3080 12G谁去测下
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-25 23:34:13 | 显示全部楼层
本帖最后由 zill25 于 2022-10-25 23:36 编辑

nvidia A100 PCE版 80G
CPU 志强 Glod 6154 14nm Skylake架构

bs=8 227ms
bs=16 414ms

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 赞一个!

查看全部评分

回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-26 12:39:29 | 显示全部楼层
zill25 发表于 2022-10-25 23:34
nvidia A100 PCE版 80G
CPU 志强 Glod 6154 14nm Skylake架构

A100速度惊人啊!!! 除了价格,无敌了
回复 支持 反对

使用道具 举报

13

主题

130

帖子

4210

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4210
发表于 2022-11-13 19:06:19 | 显示全部楼层
这个测试是不是应该还要限定 src和dst的素材 大家都用一样的,这个模型,我发现我src和dst素材张数少的情况下 batch_size=8  能跑500ms  显卡是3060ti,素材量大的时候 速度就慢了batch_size=8 要1000ms上下,所以你这里只限制参数不限制素材 测试没对比性吧
回复 支持 反对

使用道具 举报

8

主题

74

帖子

692

积分

高级丹师

Rank: 5Rank: 5

积分
692
发表于 2022-11-13 22:41:50 | 显示全部楼层
IAW 发表于 2022-9-17 21:14
3090ti,BS4时为174MS左右,BS8为285MS左右,BS16为480MS左右浮动
models_opt_on_gpu全为True ...

你好。你用的是什么型号cpu
回复 支持 反对

使用道具 举报

8

主题

74

帖子

692

积分

高级丹师

Rank: 5Rank: 5

积分
692
发表于 2022-11-13 22:46:21 | 显示全部楼层
nicky9999 发表于 2022-9-18 12:32
我的测试:
nvidia 3090 24G
MODEL ZIBI2.0训练参数同楼主

你好。你用的是什么型号cpu
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-29 03:08 , Processed in 0.099397 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表