deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: WinKK

来交流一下显卡的训练速度吧

  [复制链接]

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-14 15:44:18 | 显示全部楼层
dfangel 发表于 2022-10-14 15:28
我3070显卡8G显存可用只有5.36,请教一下你是怎么做到6.8的?

这是系统和驱动软件的问题吧,我这是A卡,你是N卡,有差别正常
回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-14 15:46:29 | 显示全部楼层
griffinycx 发表于 2022-10-14 15:09
更新了老哥,同样参数。显卡4090
BS=4 130ms BS=8 230ms BS=16 345ms

4090果然比3090还要快。虽然速度没翻倍,但可能是软件和驱动没跟上。
回复 支持 反对

使用道具 举报

59

主题

457

帖子

2731

积分

初级丹圣

Rank: 8Rank: 8

积分
2731
发表于 2022-10-14 17:22:06 | 显示全部楼层
WinKK 发表于 2022-10-14 15:46
4090果然比3090还要快。虽然速度没翻倍,但可能是软件和驱动没跟上。

跑点 大分辨率的 高参数的 才能测试极限

比如wf 512 df-dut 其他4个参数 512 96 96 32

要么测试 wf 384 df-tc 其他4个参数 512 96 96 32
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-18 01:53:13 | 显示全部楼层
qiuyuande 发表于 2022-10-14 17:22
跑点 大分辨率的 高参数的 才能测试极限

比如wf 512 df-dut 其他4个参数 512 96 96 32

512分辨率毫无必要.....99%的素材都喂不饱
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-19 04:47:07 | 显示全部楼层
Tesla V100-FHHL-16GB
bs=4 395ms
bs=8 635ms
bs=16 1360ms

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 赞一个!

查看全部评分

回复 支持 反对

使用道具 举报

2

主题

27

帖子

609

积分

高级丹师

Rank: 5Rank: 5

积分
609
发表于 2022-10-19 05:51:53 | 显示全部楼层
微星笔记本的3080ti,256模型,batchsize8,340左右迭代一次,怎么感觉比楼上的3090ti还牛逼
回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-19 06:31:07 | 显示全部楼层
lpk8888 发表于 2022-10-19 05:51
微星笔记本的3080ti,256模型,batchsize8,340左右迭代一次,怎么感觉比楼上的3090ti还牛逼 ...

我前面给了一个具体的模型,你按这个参数跑一下才好比较啊。不过,3080TI本来就很强,与3090相关不多的
回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2022-10-19 06:32:30 | 显示全部楼层
zill25 发表于 2022-10-19 04:47
Tesla V100-FHHL-16GB
bs=4 395ms
bs=8 635ms

多谢

不过,TESLA V100应该比1080TI强不少啊,怎么看结果差不多呢?
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-19 11:43:33 | 显示全部楼层
WinKK 发表于 2022-10-19 06:32
多谢

不过,TESLA V100应该比1080TI强不少啊,怎么看结果差不多呢? ...

因为滚石云的CPU辣鸡
回复 支持 反对

使用道具 举报

16

主题

207

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12850
发表于 2022-10-19 12:32:00 | 显示全部楼层
Nvidia A40 (基本等同于Quadro RTX A6000)
BS=4  210
BS=8  360
BS=16  660

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 赞一个!

查看全部评分

回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-29 03:06 , Processed in 0.103701 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表