deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: WinKK

来交流一下显卡的训练速度吧

  [复制链接]

3

主题

80

帖子

2265

积分

初级丹圣

Rank: 8Rank: 8

积分
2265
发表于 2023-1-15 18:59:27 | 显示全部楼层
本帖最后由 明年夏天 于 2023-1-15 19:00 编辑
王远彦 发表于 2023-1-15 14:17
不知道咋回事   我的也只显示20.多的显存

你的才20.几?我的正好90%,是21.6GB
不过我其他模型跑的话是显示24GB的

然后跑自闭6.0的SB=16的话,大概率内存报错……
回复 支持 反对

使用道具 举报

2

主题

19

帖子

291

积分

初级丹师

Rank: 3Rank: 3

积分
291
发表于 2023-1-17 18:52:40 | 显示全部楼层
明年夏天 发表于 2023-1-15 18:59
你的才20.几?我的正好90%,是21.6GB
不过我其他模型跑的话是显示24GB的

内存报啥错?   是不是虚拟内存设小了?
回复 支持 反对

使用道具 举报

3

主题

80

帖子

2265

积分

初级丹圣

Rank: 8Rank: 8

积分
2265
发表于 2023-1-18 22:29:52 | 显示全部楼层
王远彦 发表于 2023-1-17 18:52
内存报啥错?   是不是虚拟内存设小了?

可能是吧,还没仔细测试。
发现一个情况,我用0104版本软件跑,就能显示24GB的内存哦
回复 支持 反对

使用道具 举报

1

主题

15

帖子

172

积分

高级丹童

Rank: 2

积分
172
发表于 2023-1-29 15:48:01 | 显示全部楼层
请问一下,是不是用刚刚解压出来的教学模型来测试?然后设置对应的参数?我用的是 2060S想测试下,对照一下T40
回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2023-1-29 15:54:14 | 显示全部楼层
k15992141830 发表于 2023-1-29 15:48
请问一下,是不是用刚刚解压出来的教学模型来测试?然后设置对应的参数?我用的是 2060S想测试下,对照一下 ...

你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

2060S和T40的数据都没有,请测试一下吧。

多谢!
回复 支持 反对

使用道具 举报

1

主题

15

帖子

172

积分

高级丹童

Rank: 2

积分
172
发表于 2023-1-29 16:11:43 | 显示全部楼层
WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

我说错了,我的2060s 对照一下tesla P40不好意思
回复 支持 反对

使用道具 举报

1

主题

15

帖子

172

积分

高级丹童

Rank: 2

积分
172
发表于 2023-1-29 16:14:22 | 显示全部楼层
WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

BS16报错不知道为什么
回复 支持 反对

使用道具 举报

1

主题

15

帖子

172

积分

高级丹童

Rank: 2

积分
172
发表于 2023-1-29 16:25:51 | 显示全部楼层
WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

2060s
BS:4       422ms
BS:8       737ms
BS:16     不知道为何报错
报错信息(ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[16,528,64,64] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
         [[node Add_24 (defined at E:\DeepFaceLab\DeepFaceLab_NVIDIA_up_to_RTX2080Ti\_internal\DeepFaceLab\core\leras\layers\Conv2D.py:107) ]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.

         [[node concat_4 (defined at E:\DeepFaceLab\DeepFaceLab_NVIDIA_up_to_RTX2080Ti\_internal\DeepFaceLab\models\Model_SAEHD\Model.py:562) ]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.)

评分

参与人数 1贡献 +1 收起 理由
WinKK + 1 很给力!

查看全部评分

回复 支持 反对

使用道具 举报

50

主题

1224

帖子

8050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8050
 楼主| 发表于 2023-1-29 16:44:05 | 显示全部楼层
k15992141830 发表于 2023-1-29 16:25
2060s
BS:4       422ms
BS:8       737ms

多谢!

BS=16时,可能是显存不够了。可以设置models_opt_on_gpu: False或用RG版本。
回复 支持 反对

使用道具 举报

1

主题

15

帖子

172

积分

高级丹童

Rank: 2

积分
172
发表于 2023-1-29 17:42:45 | 显示全部楼层
WinKK 发表于 2023-1-29 16:44
多谢!

BS=16时,可能是显存不够了。可以设置models_opt_on_gpu: False或用RG版本。 ...

我试试,请教一下RG版本是什么意思?
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-29 03:07 , Processed in 0.100753 second(s), 9 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表