deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 728|回复: 10

求助:按enter结束训练时蓝屏死机,重启后故障

[复制链接]

7

主题

63

帖子

553

积分

高级丹师

Rank: 5Rank: 5

积分
553
 楼主| 发表于 2023-1-29 14:58:04 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
这两天突然出现的问题,训练一段时间后,按enter键结束训练退出时蓝屏死机,重启后不管是训练还是合成都报错,要从backup文件夹把备份的model文件拷贝出来覆盖掉死机时正在训练的model文件后才能正常,连续碰到了几次,在训练的是论坛里购买下载的各种万能丹和专丹,一开始以为是显卡过热导致的,今天显卡温度并不高,特发帖求助。




选择一个或多个 GPU 编号(以逗号分隔).

[CPU] : CPU
  [0] : NVIDIA GeForce RTX 3060 Ti

[0] 选择哪些 GPU 索引? :
0

Initializing models:   0%|                                                                       | 0/9 [00:00<?, ?it/s]
Error: invalid load key, '\x00'.
Traceback (most recent call last):
  File "C:\deepfacelap\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\mainscripts\Trainer.py", line 58, in trainerThread
    debug=debug)
  File "C:\deepfacelap\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\models\ModelBase.py", line 199, in __init__
    self.on_initialize()
  File "C:\deepfacelap\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\models\Model_SAEHD\Model.py", line 654, in on_initialize
    do_init = not model.load_weights( self.get_strpath_storage_for_file(filename) )
  File "C:\deepfacelap\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\core\leras\layers\Saveable.py", line 72, in load_weights
    d = pickle.loads(d_dumped)
_pickle.UnpicklingError: invalid load key, '\x00'.


回复

使用道具 举报

10

主题

265

帖子

1703

积分

初级丹圣

Rank: 8Rank: 8

积分
1703
发表于 2023-1-29 15:07:30 | 显示全部楼层
还没有遇到过,不懂,帮顶一下
回复 支持 反对

使用道具 举报

7

主题

63

帖子

553

积分

高级丹师

Rank: 5Rank: 5

积分
553
 楼主| 发表于 2023-1-29 16:47:23 | 显示全部楼层
feng7902 发表于 2023-1-29 15:07
还没有遇到过,不懂,帮顶一下

谢谢帮顶
回复 支持 反对

使用道具 举报

17

主题

131

帖子

2093

积分

初级丹圣

Rank: 8Rank: 8

积分
2093
发表于 2023-1-29 18:15:54 | 显示全部楼层
电脑问题先软后硬
软件问题重装系统
装系统无法解决就是硬件问题
替换测试
显卡问题换显卡
内存问题换内存
电源问题换电源

回复 支持 反对

使用道具 举报

2

主题

622

帖子

6645

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6645
发表于 2023-1-29 18:58:22 | 显示全部楼层
可能是硬盘有坏道了
试试放到别的硬盘操作
回复 支持 反对

使用道具 举报

1

主题

121

帖子

-380

积分

禁止访问

积分
-380
发表于 2023-1-29 22:39:25 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7

主题

63

帖子

553

积分

高级丹师

Rank: 5Rank: 5

积分
553
 楼主| 发表于 2023-1-30 16:55:18 | 显示全部楼层
正义的使者 发表于 2023-1-29 22:39
告诉你为什么  因为你模型文件保存出错坏掉了

问题就在这里了,死机后模型文件就出错了。关键是为什么保存的时候会死机,今天还碰到迭代跑了三千多死机。新系统,32G内存,3060TI 8G 。WIN10
回复 支持 反对

使用道具 举报

1

主题

121

帖子

-380

积分

禁止访问

积分
-380
发表于 2023-1-30 19:46:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7

主题

63

帖子

553

积分

高级丹师

Rank: 5Rank: 5

积分
553
 楼主| 发表于 2023-2-1 18:04:43 | 显示全部楼层

没看虚拟内存,内存32G,DDR4 3600 ,跑模型时进任务管理器看到占用11G左右,内存应该是足够的
回复 支持 反对

使用道具 举报

1

主题

121

帖子

-380

积分

禁止访问

积分
-380
发表于 2023-2-1 19:38:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-23 04:33 , Processed in 0.103198 second(s), 10 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表