deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 719|回复: 8

这个意思是自动保存了吗?崩了是不是也能从最后一次保.....

[复制链接]

14

主题

38

帖子

378

积分

初级丹师

Rank: 3Rank: 3

积分
378
 楼主| 发表于 2023-2-15 09:54:41 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
是从其他模型开始训练的,都是默认值
Y}1G]BS$D`I630[Z5UU[]U.png
回复

使用道具 举报

3

主题

523

帖子

4231

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4231

万事如意节日勋章

发表于 2023-2-15 10:53:36 | 显示全部楼层
这是自动保存,但是崩了是需要从备份(自动备份)的模型恢复
回复 支持 反对

使用道具 举报

14

主题

38

帖子

378

积分

初级丹师

Rank: 3Rank: 3

积分
378
 楼主| 发表于 2023-2-15 11:46:27 | 显示全部楼层
2772403575 发表于 2023-2-15 10:53
这是自动保存,但是崩了是需要从备份(自动备份)的模型恢复

oo,比如现在崩了,再渲染是从保存时间9:51的那里开始训练吗
回复 支持 反对

使用道具 举报

7

主题

867

帖子

5752

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5752

万事如意节日勋章

发表于 2023-2-15 11:57:49 | 显示全部楼层
分几种情况,
一种简单些,就是训练中(保存前)程序出现异常,直接关掉程序重新训练即可,这时候是最近一次程序自动保存的进度.
二种是保存中程序出错,一般情况下模型就会坏掉,需要手动恢复备份的模型文件继续训练,这时候就是恢复的模型的进度
三种是挂机训练,发现不知道什么时候模型炸了,这个时候就需要从备份模型中从近到远挨个试,直到恢复到正常.

model目录里面的文件是当前使用和训练的模型文件,训练中程序每隔25分钟会自动保存训练进度和数据到这里.训练中是不会写入的,所以程序崩掉或强制关掉对模型数据没啥影响.
model/xxxx_autobackups目录里面是每隔多久程序自动备份的模型文件.
回复 支持 反对

使用道具 举报

3

主题

523

帖子

4231

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4231

万事如意节日勋章

发表于 2023-2-15 12:22:15 | 显示全部楼层
aa2249715850 发表于 2023-2-15 11:46
oo,比如现在崩了,再渲染是从保存时间9:51的那里开始训练吗

你没懂我的意思,保存的意思是无论你保存了多少次,它始终是一个模型。你每保存一次你下次训练就会接着你上次保存的进度开始训练,言外之义就是如果你在爆丹的情况下保存了,那么这个模型就废了,你是不能选择在某个时间点去恢复的;而备份就不一样,备份是将你当前状态的模型文件复制一份新建个文件夹存放起来,当你的本源模型崩溃(炸丹了),将备份的模型文件复制替换掉崩掉的本源模型继续训练
回复 支持 反对

使用道具 举报

3

主题

523

帖子

4231

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4231

万事如意节日勋章

发表于 2023-2-15 12:24:41 | 显示全部楼层
所以定期的备份操作是必要的,特别是在开关某些训练参数或者阶段性训练的开始
回复 支持 反对

使用道具 举报

3

主题

523

帖子

4231

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4231

万事如意节日勋章

发表于 2023-2-15 12:28:12 | 显示全部楼层
aa2249715850 发表于 2023-2-15 11:46
oo,比如现在崩了,再渲染是从保存时间9:51的那里开始训练吗

这里崩了往往是指模型的梯度爆炸Loss不降反而异常上升,模型预览图异常。程序崩溃无所谓,重新启动的确是会从比如保存时间9:51的那里开始训练
回复 支持 反对

使用道具 举报

14

主题

38

帖子

378

积分

初级丹师

Rank: 3Rank: 3

积分
378
 楼主| 发表于 2023-2-15 12:40:22 | 显示全部楼层
2772403575 发表于 2023-2-15 12:28
这里崩了往往是指模型的梯度爆炸Loss不降反而异常上升,模型预览图异常。程序崩溃无所谓,重新启动的确是 ...

哦哦,原来如此,谢谢
回复 支持 反对

使用道具 举报

4

主题

106

帖子

1344

积分

初级丹圣

Rank: 8Rank: 8

积分
1344
发表于 2023-2-15 16:37:12 | 显示全部楼层
谢谢分享
回复

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-23 07:31 , Processed in 0.100654 second(s), 10 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表