deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 670|回复: 23

找ai撸了一晚上代码,终于实现训练过程中学习率的动态调整

[复制链接]

40

主题

555

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19142
 楼主| 发表于 5 天前 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 dfl9999 于 2025-8-13 01:41 编辑







1000055925.jpg








由于dfl优化器没有学习率预热、衰减之类的功能,学习率是固定的,5e-05这个值是偏大的,导致模型参数空间探索有限,很容易陷入局部最优,让学习率在5e-05和1e-05之间循环,每2万个迭代更新一次,10万迭代一个循环,以后练的模型直接起飞了

————————
文件已经放附件,只支持合体版DFL,位置deep\DFL1120_RTX30\_internal\DeepFaceLab\models\Model_SAEHD,直接替换Model.py。
注意:支持从0开始预训练或者正式训练模型,备份原有文件,不需要循环的时候再恢复回来,替换会修改原ui界面缩放大小,对1080P和2k屏幕支持不是很好,需要4K分辨率才能全部展示,模型收敛微调阶段建议替换回原来文件,并将学习率固定成1e-05.

Model.zip

15.24 KB, 下载次数: 11

评分

参与人数 2贡献 +2 收起 理由
sex871 + 1 十分给力!
bensheng + 1 十分给力!

查看全部评分

回复

使用道具 举报

6

主题

264

帖子

2062

积分

初级丹圣

Rank: 8Rank: 8

积分
2062

万事如意节日勋章

发表于 4 天前 | 显示全部楼层
stuff like this is being worked on by DeepAscension V2 Devs and better
回复 支持 反对

使用道具 举报

40

主题

555

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19142
 楼主| 发表于 4 天前 | 显示全部楼层
Cxsmo 发表于 2025-8-11 02:09
stuff like this is being worked on by DeepAscension V2 Devs and better

Unless the developers can make a major breakthrough in gan modeling, some minor feature tweaks why should I bother waiting? Dynamic learning rate and locking encoder have been implemented on faceice for a long time, dfl doesn't have any meaningful updates
回复 支持 反对

使用道具 举报

1

主题

4

帖子

156

积分

高级丹童

Rank: 2

积分
156
发表于 4 天前 | 显示全部楼层
代码呢?
回复

使用道具 举报

8

主题

156

帖子

1435

积分

初级丹圣

Rank: 8Rank: 8

积分
1435

万事如意节日勋章

发表于 4 天前 | 显示全部楼层
可以共享一下代码吗?
回复 支持 反对

使用道具 举报

11

主题

363

帖子

3023

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3023

万事如意节日勋章

发表于 4 天前 | 显示全部楼层
这是什么意思?
回复 支持 反对

使用道具 举报

226

主题

2076

帖子

79万

积分

管理员

Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96

积分
799647

隐世金马甲勋章超级版主勋章可爱萌新勋章见习版主勋章荣誉会员勋章男同管理员-无尚荣耀勋章优质版主勋章小有贡献勋章

发表于 4 天前 | 显示全部楼层
不是很需要的吧,用的优化器本身就自带类似于学习率调整的功能,能根据每一步的训练结果动态调整步幅
提供数字人直播服务、文字/音频驱动数字人服务,有意者联系我QQ563861181
全站默认解压密码dfldata.xyz
DFL交流QQ群五群974612885
AI绘画交流QQ群1040635623
我的B站账号:特看科技的滚石   其他自称彦祖的不是我,请勿上当
回复 支持 反对

使用道具 举报

40

主题

555

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19142
 楼主| 发表于 4 天前 | 显示全部楼层
滚石 发表于 2025-8-11 16:49
不是很需要的吧,用的优化器本身就自带类似于学习率调整的功能,能根据每一步的训练结果动态调整步幅 ...

优化器调整的不是全局学习率,只是部分微参的自适应学习率,我是因为要训练预训练模型,所以需要这个功能,正式训练有lrd
回复 支持 反对

使用道具 举报

40

主题

555

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19142
 楼主| 发表于 4 天前 | 显示全部楼层
mjy9921130 发表于 2025-8-11 09:23
可以共享一下代码吗?

你们不训练预训练模型的话这个功能对你们用处不大
回复 支持 反对

使用道具 举报

40

主题

555

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19142
 楼主| 发表于 4 天前 | 显示全部楼层
bg2kcg 发表于 2025-8-11 10:34
这是什么意思?

就是以前是固定学习率,现在允许学习率像正弦波一样周期性自动调整
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-8-15 08:58 , Processed in 0.112445 second(s), 41 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表