deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1463|回复: 23

不懂就问,我这情况是换卡还是怎么操作?

[复制链接]

1

主题

13

帖子

70

积分

高级丹童

Rank: 2

积分
70
 楼主| 发表于 2023-9-27 15:32:23 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
现在用的是RTX4060显卡,训练调试选项如图,批量2都跑不起来,一直提示


Error: 2 root error(s) found.
  (0) Resource exhausted: OOM when allocating tensor with shape[3,3,2048,2048] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
         [[node src_dst_opt_1/Select_26 (defined at C:\Users\1\软件\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\core\leras\ops\__init__.py:212) ]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info. This isn't available when running in Eager mode.

这个要换一张16G的显卡?还是可以调一下显存开始跑?图3的设置批量2可以跑,但改一下设置之后就跑不动了。
来个大佬解答一下
photo_2023-09-27_14-01-31.jpg
photo_2023-09-27_14-15-29.jpg

图3

图3
回复

使用道具 举报

3

主题

76

帖子

1453

积分

初级丹圣

Rank: 8Rank: 8

积分
1453

万事如意节日勋章

发表于 2023-9-27 15:57:22 | 显示全部楼层
这个丹是自己新建的吗?我看论坛分辨率224的丹auto encode一般是256,你这个ae_mids=512,是很高的参数,16G显存也许还跑不动
回复 支持 反对

使用道具 举报

2

主题

75

帖子

1061

积分

初级丹圣

Rank: 8Rank: 8

积分
1061
发表于 2023-9-27 16:03:50 | 显示全部楼层
批量数据超了显存,可以尝试RG版本,时间换显存,或者直接4090 走起
回复 支持 反对

使用道具 举报

1

主题

13

帖子

70

积分

高级丹童

Rank: 2

积分
70
 楼主| 发表于 2023-9-27 16:03:58 | 显示全部楼层
llon 发表于 2023-9-27 15:57
这个丹是自己新建的吗?我看论坛分辨率224的丹auto encode一般是256,你这个ae_mids=512,是很高的参数,16 ...

对,自己弄的丹,src最初16w张,被我删到6w,我看教程他们15g的显存也是调512。跟着调的
回复 支持 反对

使用道具 举报

1

主题

13

帖子

70

积分

高级丹童

Rank: 2

积分
70
 楼主| 发表于 2023-9-27 16:08:14 | 显示全部楼层
醉卧二两仙 发表于 2023-9-27 16:03
批量数据超了显存,可以尝试RG版本,时间换显存,或者直接4090 走起

RG版本是什么?这个ae_mids=512这里太高了?
回复 支持 反对

使用道具 举报

2

主题

75

帖子

1061

积分

初级丹圣

Rank: 8Rank: 8

积分
1061
发表于 2023-9-27 16:18:20 | 显示全部楼层
这个数值确实大了点,猫224神丹是这个一半。还有你有两个 power 0.1    1.0 ,一般模型不开的.论坛里搜搜 ICE 木兰  版本,批量应该能开到4
回复 支持 反对

使用道具 举报

1

主题

13

帖子

70

积分

高级丹童

Rank: 2

积分
70
 楼主| 发表于 2023-9-27 16:31:23 | 显示全部楼层
醉卧二两仙 发表于 2023-9-27 16:18
这个数值确实大了点,猫224神丹是这个一半。还有你有两个 power 0.1    1.0 ,一般模型不开的.论坛里搜搜 I ...

嗯,那如果我把这个调成246-256,再换一张16G显卡,是不是可以跑批量8?
回复 支持 反对

使用道具 举报

3

主题

76

帖子

1453

积分

初级丹圣

Rank: 8Rank: 8

积分
1453

万事如意节日勋章

发表于 2023-9-27 18:22:54 | 显示全部楼层
dd373664 发表于 2023-9-27 16:31
嗯,那如果我把这个调成246-256,再换一张16G显卡,是不是可以跑批量8?

改256,bs=8,4060不用换
回复 支持 反对

使用道具 举报

0

主题

2

帖子

25

积分

初级丹童

Rank: 1

积分
25
发表于 2023-9-27 18:46:32 | 显示全部楼层
有详细教程么?
回复 支持 反对

使用道具 举报

1

主题

165

帖子

2346

积分

初级丹圣

Rank: 8Rank: 8

积分
2346
发表于 2023-9-27 19:00:30 | 显示全部楼层
显存溢出
回复

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-24 02:32 , Processed in 0.101384 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表