deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 351|回复: 10

大佬求助,HRESULT failed with 0x887a0005错误

[复制链接]

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-14 16:56:14 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
tensorflow/c/logging.cc:43] HRESULT failed with 0x887a0005: chunk->resource->Map(0, nullptr, &upload_heap_data)

训练过程中的,没几分钟就跳这个错误。还有一个很小白的问题
image.png
image.png
回复

使用道具 举报

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-14 16:57:58 | 显示全部楼层
本帖最后由 欧阳娜娜 于 2024-8-14 17:00 编辑

小白问题,想先训练10W步,为啥迭代步数填100000几秒钟就提示已经到了设定值了?
遮罩用的镇站之宝,预训练模型用的五彩大佬的320。SRC素材是论坛里1024尺寸的
回复 支持 反对

使用道具 举报

13

主题

119

帖子

1384

积分

初级丹圣

Rank: 8Rank: 8

积分
1384
发表于 2024-8-15 00:03:40 | 显示全部楼层
一般这种问题都是显存不够。dml会占用内存,根据我的经验dml会先使用显卡的显存然后占用内存,如果你电脑在训练的时候开了其他东西,使用到的内存有波动(变大)就会报错。如果你是N卡,用1120那个版本比较好,如果你是A卡用0504的dx12版(dx12能开的bs实际比dml的大)。N卡1120猫之汉化大佬有汉化好的,如果是A卡,你翻我帖子,我把猫之汉化的中文搬到0504DX12上了
第二个问题,你那个模型迭代数清零了吗
回复 支持 反对

使用道具 举报

18

主题

232

帖子

3362

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3362
发表于 2024-8-15 08:36:19 | 显示全部楼层
fghfdg 发表于 2024-8-15 00:03
一般这种问题都是显存不够。dml会占用内存,根据我的经验dml会先使用显卡的显存然后占用内存,如果你电脑在 ...

dml版本默认会使用一部分内存不管你显存够不够、大还是小,他的内存应该是16g的,系统占一半,剩下的所剩无几,用这个版本纯纯的负优化
回复 支持 反对

使用道具 举报

13

主题

119

帖子

1384

积分

初级丹圣

Rank: 8Rank: 8

积分
1384
发表于 2024-8-15 10:17:04 | 显示全部楼层
dfl9999 发表于 2024-8-15 08:36
dml版本默认会使用一部分内存不管你显存够不够、大还是小,他的内存应该是16g的,系统占一半,剩下的所剩 ...

我内存128g,日常占用23g左右,用dml版本会使用一部分内存,当当前使用内存超过31g的时候就会报错。用dml还不如用dx12
回复 支持 反对

使用道具 举报

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-15 13:02:34 | 显示全部楼层
fghfdg 发表于 2024-8-15 10:17
我内存128g,日常占用23g左右,用dml版本会使用一部分内存,当当前使用内存超过31g的时候就会报错。用dml ...

害,那从软件层面就先走歪路了。DML使用说明我去细看下确实是占用一部分内存...
回复 支持 反对

使用道具 举报

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-15 13:08:22 | 显示全部楼层
fghfdg 发表于 2024-8-15 00:03
一般这种问题都是显存不够。dml会占用内存,根据我的经验dml会先使用显卡的显存然后占用内存,如果你电脑在 ...

用的N卡3070,第二个问题,模型迭代在一开始设置的时候需要清零吗
回复 支持 反对

使用道具 举报

0

主题

20

帖子

170

积分

高级丹童

Rank: 2

积分
170
发表于 2024-8-16 02:18:54 | 显示全部楼层
本帖最后由 franknt 于 2024-8-16 05:52 编辑

我也是这个问题唉,大佬解决了吗?? 我虚拟内存后面加了10g,还多了一条报错


CUP:i7-10700
显卡:4080s 16g
内存:64g ,虚拟内存170g
1.jpg
2.jpg
回复 支持 反对

使用道具 举报

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-16 10:47:16 | 显示全部楼层
franknt 发表于 2024-8-16 02:18
我也是这个问题唉,大佬解决了吗?? 我虚拟内存后面加了10g,还多了一条报错

换小一点的bs值呢。
回复 支持 反对

使用道具 举报

4

主题

30

帖子

206

积分

初级丹师

Rank: 3Rank: 3

积分
206
 楼主| 发表于 2024-8-16 11:36:23 | 显示全部楼层
image.jpeg
这里是否需要重置迭代计数器和Loss图。什么时候需要开启或关闭?
目标迭代次数应该怎么填?比如我想训练10万步,是填10W还是100000。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-10-25 01:25 , Processed in 0.093303 second(s), 10 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表