来交流一下显卡的训练速度吧

明年夏天 · 发表于 2023-1-15 18:59:27

本帖最后由明年夏天于 2023-1-15 19:00 编辑

王远彦发表于 2023-1-15 14:17
不知道咋回事我的也只显示20.多的显存

你的才20.几？我的正好90%，是21.6GB
不过我其他模型跑的话是显示24GB的

然后跑自闭6.0的SB=16的话，大概率内存报错……

王远彦 · 发表于 2023-1-17 18:52:40

明年夏天发表于 2023-1-15 18:59
你的才20.几？我的正好90%，是21.6GB
不过我其他模型跑的话是显示24GB的

内存报啥错？是不是虚拟内存设小了？

明年夏天 · 发表于 2023-1-18 22:29:52

王远彦发表于 2023-1-17 18:52
内存报啥错？是不是虚拟内存设小了？

可能是吧，还没仔细测试。
发现一个情况，我用0104版本软件跑，就能显示24GB的内存哦

k15992141830 · 发表于 2023-1-29 15:48:01

请问一下，是不是用刚刚解压出来的教学模型来测试？然后设置对应的参数？我用的是 2060S想测试下，对照一下T40

WinKK · 发表于 2023-1-29 15:54:14

k15992141830 发表于 2023-1-29 15:48
请问一下，是不是用刚刚解压出来的教学模型来测试？然后设置对应的参数？我用的是 2060S想测试下，对照一下 ...

你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

2060S和T40的数据都没有，请测试一下吧。

多谢！

k15992141830 · 发表于 2023-1-29 16:11:43

WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

我说错了，我的2060s 对照一下tesla P40不好意思

k15992141830 · 发表于 2023-1-29 16:14:22

WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

BS16报错不知道为什么

k15992141830 · 发表于 2023-1-29 16:25:51

WinKK 发表于 2023-1-29 15:54
你按这个参数新建一个模型就行啊。SRC和DST随便弄一个。

我就是要对比一下各显卡的训练速度

2060s
BS:4    422ms
BS:8    737ms
BS:16    不知道为何报错
报错信息（ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[16,528,64,64] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
      [[node Add_24 (defined at E:\DeepFaceLab\DeepFaceLab_NVIDIA_up_to_RTX2080Ti\_internal\DeepFaceLab\core\leras\layers\Conv2D.py:107) ]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.

      [[node concat_4 (defined at E:\DeepFaceLab\DeepFaceLab_NVIDIA_up_to_RTX2080Ti\_internal\DeepFaceLab\models\Model_SAEHD\Model.py:562) ]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.）

WinKK · 发表于 2023-1-29 16:44:05

k15992141830 发表于 2023-1-29 16:25
2060s
BS:4 422ms
BS:8 737ms

多谢！

BS=16时，可能是显存不够了。可以设置models_opt_on_gpu: False或用RG版本。

k15992141830 · 发表于 2023-1-29 17:42:45

WinKK 发表于 2023-1-29 16:44
多谢！

BS=16时，可能是显存不够了。可以设置models_opt_on_gpu: False或用RG版本。 ...

我试试，请教一下RG版本是什么意思？

		自动登录	找回密码
密码			立即注册（仅限QQ邮箱）

来交流一下显卡的训练速度吧

评分

浏览过的版块