deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 360|回复: 5

模型复用lr_dropout是不是真的影响泛化学习,求滚石解惑

[复制链接]

35

主题

502

帖子

2921

积分

初级丹圣

Rank: 8Rank: 8

积分
2921

万事如意节日勋章

 楼主| 发表于 2024-3-24 09:31:31 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
     重新练了模型,有点拿不住注意了

     lr_dropout是走捷径,会削弱了模型推演,复用模型如果开过就要一直开,不能关,而且学习的范围框死了,是真的吗?
回复

使用道具 举报

7

主题

72

帖子

5014

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5014
发表于 2024-3-24 12:01:53 | 显示全部楼层
坐等大佬解答,我来学习一下
回复 支持 反对

使用道具 举报

9

主题

1931

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
10696

真我风采勋章万事如意节日勋章

发表于 2024-3-24 12:07:35 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-3-24 12:15 编辑

预训练由于是作为起始丹,需要N次复用,所以不要开,完工后留好文件,作为无限量的专丹前置。
以后用上述副本,进行正训变成专丹时,可以开了至成品后,此副本封丹(不复用,只合成)。
回复 支持 反对

使用道具 举报

1

主题

115

帖子

677

积分

高级丹师

Rank: 5Rank: 5

积分
677

万事如意节日勋章

发表于 2024-3-24 14:03:19 | 显示全部楼层
先不管这个问题有没有正确答案。别人提供的丹,基本都开过LRD了,你用还是不用。如果是自己炼的预训练丹,那这问题也很好处理啊,在开LRD前备份,复用丹就用这个备份的。
回复 支持 反对

使用道具 举报

9

主题

221

帖子

4485

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4485

万事如意节日勋章

发表于 2024-3-25 08:56:59 | 显示全部楼层
肯定影响,模型收敛了就丧失泛化能力了,要复用且换src的话要重新开始扭,换dst问题不大
回复 支持 反对

使用道具 举报

59

主题

457

帖子

2653

积分

初级丹圣

Rank: 8Rank: 8

积分
2653
发表于 2024-3-25 10:23:11 | 显示全部楼层
本帖最后由 qiuyuande 于 2024-3-25 10:28 编辑

练万能底丹 就不要开学习率  同样一个底丹 一个开了的 一个没开的 经过大量多种测试,开了学习率的对比没开学习率的,在学习某些东西的时候会慢些。所以练底丹 开了学习率的 没有没开学习率的泛化好! 建议练底丹不要开学习率,等你练好底丹备份好,以后复用了,随便整,反正有底丹在 起步就很快了!
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-5-18 19:31 , Processed in 0.085373 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表