deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1729|回复: 15

我用SAEHD训练一直MemoryError报错是为什么

[复制链接]

2

主题

8

帖子

48

积分

初级丹童

Rank: 1

积分
48
 楼主| 发表于 2023-7-16 00:42:35 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 發小发 于 2023-7-16 00:43 编辑

我是6g显存的笔记本4050,虚拟内存设置的100g,训练开始的时候命令框里显示显存是3.35g。各项参数也调得不算高,请问该怎么解决呢
屏幕截图 2023-07-15 233154.png

回复

使用道具 举报

8

主题

147

帖子

1617

积分

初级丹圣

Rank: 8Rank: 8

积分
1617

节日欢乐之星勋章

发表于 2023-7-16 00:58:52 | 显示全部楼层
感觉还是内存问题,看看虚拟内存设置的对不对吧,或者看看bs设置的再小点。我也是新手,还在摸索中。
回复 支持 反对

使用道具 举报

2

主题

8

帖子

48

积分

初级丹童

Rank: 1

积分
48
 楼主| 发表于 2023-7-16 01:02:17 | 显示全部楼层
hhgg2277 发表于 2023-7-16 00:58
感觉还是内存问题,看看虚拟内存设置的对不对吧,或者看看bs设置的再小点。我也是新手,还在摸索中。 ...

虚拟内存最小值要设多少啊,bs都已经是1了也不行,我是昨天才开始学这个的
回复 支持 反对

使用道具 举报

13

主题

1049

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12735
发表于 2023-7-16 01:21:41 | 显示全部楼层
训练的时候有个设置,把模型放gpu,你试下改成放cpu。还有学习率下降也可以设在cpu
回复 支持 反对

使用道具 举报

8

主题

147

帖子

1617

积分

初级丹圣

Rank: 8Rank: 8

积分
1617

节日欢乐之星勋章

发表于 2023-7-16 01:24:46 | 显示全部楼层
發小发 发表于 2023-7-16 01:02
虚拟内存最小值要设多少啊,bs都已经是1了也不行,我是昨天才开始学这个的 ...

我最大值和最小值都是一个数值,设置的是60G在D盘。
回复 支持 反对

使用道具 举报

8

主题

147

帖子

1617

积分

初级丹圣

Rank: 8Rank: 8

积分
1617

节日欢乐之星勋章

发表于 2023-7-16 01:28:54 | 显示全部楼层
發小发 发表于 2023-7-16 01:02
虚拟内存最小值要设多少啊,bs都已经是1了也不行,我是昨天才开始学这个的 ...

还有一个模型设置最后边开启预训练的选项,我的如果开启就报错,关了就正常。
回复 支持 反对

使用道具 举报

13

主题

1049

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12735
发表于 2023-7-16 02:07:36 | 显示全部楼层
hhgg2277 发表于 2023-7-16 01:28
还有一个模型设置最后边开启预训练的选项,我的如果开启就报错,关了就正常。 ...

那个预训练的意思是拿celeb_A那个数据集开荒。。猫之汉化删掉了那数据集,自然就没有啦。
回复 支持 反对

使用道具 举报

1

主题

89

帖子

2065

积分

初级丹圣

Rank: 8Rank: 8

积分
2065

节日欢乐之星勋章

发表于 2023-7-16 09:24:56 | 显示全部楼层
版本错了吧,你显卡什么型号的?有20和1060专用的版本,看你目录名称应该是用的30系以上显卡的版本,换20系的版本就可以了。
回复 支持 反对

使用道具 举报

2

主题

8

帖子

48

积分

初级丹童

Rank: 1

积分
48
 楼主| 发表于 2023-7-16 09:54:44 | 显示全部楼层
sd4981480 发表于 2023-7-16 09:24
版本错了吧,你显卡什么型号的?有20和1060专用的版本,看你目录名称应该是用的30系以上显卡的版本,换20系 ...

40系显卡不是要用30系的版本吗,一开始不懂,下的老版本用不了的
回复 支持 反对

使用道具 举报

2

主题

8

帖子

48

积分

初级丹童

Rank: 1

积分
48
 楼主| 发表于 2023-7-16 10:45:53 | 显示全部楼层
seancai110 发表于 2023-7-16 01:21
训练的时候有个设置,把模型放gpu,你试下改成放cpu。还有学习率下降也可以设在cpu ...

用cpu居然可以跑了,可是完全没用上显卡不会对cpu造成很大负荷而且效率不高吗
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-24 07:36 , Processed in 0.134559 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表