deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 430|回复: 10

一直看到说泛化,其实泛化是啥意思??怎么看泛化行不行

[复制链接]

15

主题

61

帖子

377

积分

初级丹师

Rank: 3Rank: 3

积分
377
 楼主| 发表于 2024-10-21 13:40:18 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
一直看到说泛化,其实泛化是啥意思??怎么看泛化行不行
回复

使用道具 举报

5

主题

81

帖子

486

积分

初级丹师

Rank: 3Rank: 3

积分
486
发表于 2024-10-21 19:51:53 | 显示全部楼层
本帖最后由 nde2024 于 2024-10-21 19:57 编辑

DFL模型,无论是DF架构还是LIAE架构,都是基于深度学习的模型。评估这类模型的性能时,泛化性 (Generalization) 是一个重要的指标。

泛化性指的是模型在未见过的新数据上的表现能力。比如,你用数据集A(训练集)来训练模型,模型在A上的表现很好。接着,你用一个完全不同的数据集B(测试集)来测试。如果模型在测试集B上也表现出色,说明模型泛化性好。

如果模型只在训练集A上表现优秀,而在测试集B上表现不好,那说明模型可能过拟合了,意味着它只“记住”了训练集A的特征。如果模型在训练集和测试集上都表现不佳,那就是欠拟合,说明模型没有学到有用的特征。

简单来说:

如果你训练了一个模型,预览图的第二、第四和第五列图片看起来很好,然后你换上全新的SRC和DST(模型从未见过的数据),如果LOSS值快速下降,预览图快速变得清晰,那么说明你的模型泛化性很强。

反之,如果换上新数据后,LOSS值下降缓慢,预览图模糊,成像也很慢,这说明模型可能出现了过拟合。

评分

参与人数 1贡献 +1 收起 理由
Terea + 1 清晰又有意义的回复,不赞不行!.

查看全部评分

回复 支持 2 反对 0

使用道具 举报

14

主题

2939

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15926

真我风采勋章万事如意节日勋章

发表于 2024-10-21 14:29:16 | 显示全部楼层
乐了,就字面的意思呗。。。
这也有难度???
回复 支持 反对

使用道具 举报

40

主题

861

帖子

4773

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4773

万事如意节日勋章

发表于 2024-10-21 14:48:21 | 显示全部楼层
拿n多不同的图学习
回复 支持 反对

使用道具 举报

6

主题

179

帖子

1140

积分

初级丹圣

Rank: 8Rank: 8

积分
1140
发表于 2024-10-21 14:52:51 | 显示全部楼层
泛化约等于普适即普遍适用,约等于鲁棒、通用。
泛化好的就是模型没训练到的样品也能预测出较好的结果。
回复 支持 反对

使用道具 举报

0

主题

28

帖子

334

积分

初级丹师

Rank: 3Rank: 3

积分
334
发表于 2024-10-21 23:00:12 | 显示全部楼层
我是新手,我谈一下自己的理解。泛化这个词是翻译过来故意搞高大上阻碍人自学的词,好理解的意思就是一般化,什么是一般化呢?举个例子,我们上学学数学的时候经常会有题目第一小问让你证明某某特例,最后一问呢让你在特例的基础上推导出一个适用所有情况的一般化公式,这里的一般化就是这个意思。你用一定量的输入和输出去训练模型,它根据输入运用公式得到输出,再拿着这个输出和你给的输出去对比,有区别的话就微调函数,就这么循环往复直到拿着你给的输入推导出来的输出和你给的输出几乎全部吻合。就这样模型就创建了一个自己理解的一般化函数,这样当你只给输入的时候它就能根据这个函数推导出一个合理的输出。
这个论坛那些大佬傲得很,几句话能说清的不说就喜欢呛人,谁还不是从新手过来的呢?我是从来不在这论坛提问,不但问不到有用的还只会被呛,我都是自己翻他们的帖子和B站搜教程。
回复 支持 反对

使用道具 举报

5

主题

27

帖子

851

积分

高级丹师

Rank: 5Rank: 5

积分
851
发表于 2024-10-22 00:09:43 | 显示全部楼层
泛化就是模型学习新的东西非常快,学习能力强!
回复 支持 反对

使用道具 举报

27

主题

135

帖子

883

积分

高级丹师

Rank: 5Rank: 5

积分
883
发表于 2024-11-6 15:45:20 | 显示全部楼层
nde2024 发表于 2024-10-21 19:51
DFL模型,无论是DF架构还是LIAE架构,都是基于深度学习的模型。评估这类模型的性能时,泛化性 (Generalizat ...

那请问如何做一个泛化的预训练底丹?目前我用了几万张图对练,开了rw,开了嘴眼,侧面优化进行预训练一直迭代上百万,中间需要开或者关什么参数提高泛化吗
回复 支持 反对

使用道具 举报

5

主题

81

帖子

486

积分

初级丹师

Rank: 3Rank: 3

积分
486
发表于 2024-11-6 23:19:30 | 显示全部楼层
JoyChan0808 发表于 2024-11-6 15:45
那请问如何做一个泛化的预训练底丹?目前我用了几万张图对练,开了rw,开了嘴眼,侧面优化进行预训练一直 ...


提高泛化性的方法有很多,你可以参考以下方法:

1. SRC和DST选择不同的数据集来训练。

2.在SRC和DST数据的选择上,尽可能覆盖多样化的样本,包括不同角度、光照、表情等特征。

3.避免长时间使用同一批数据。定期更换或补充SRC和DST素材。

4.参数设置:

random_warp和uniform_yaw:建议开启。
AdaBelief 和 ClipGrad: 这两个参数,虽然对泛化性没有直接帮助,但它们对模型的稳定性有明显的提升作用,建议开启。
嘴眼优化:可以在预训练阶段不开,它对泛化性没有帮助。不过,我选择开启这一选项,因为它有助于生成更自然的面部特征。
。。。。。。
还有很多可以提升泛化性的参数,根据自己的需求来开关。


总的来说,与调节参数相比,定期更换SRC和DST素材往往能带来更显著的泛化性提升。(注意:更换素材后,LOSS值也会大幅变动,故此根据自己的情况量力而为。)

每隔一段时间,可以将从未参与训练的素材分别放入SRC和DST位置进行测试,观察模型生成效果。

如果测试结果良好,说明当前训练方法有效;如果结果不理想,则可以考虑调整数据或训练策略。
回复 支持 反对

使用道具 举报

27

主题

135

帖子

883

积分

高级丹师

Rank: 5Rank: 5

积分
883
发表于 2024-11-6 23:39:19 | 显示全部楼层
本帖最后由 JoyChan0808 于 2024-11-6 23:47 编辑
nde2024 发表于 2024-11-6 23:19
提高泛化性的方法有很多,你可以参考以下方法:

1. SRC和DST选择不同的数据集来训练。

定期更换,这个定期大概多久,需要训练到本次数据集清晰吗,例如细节,像牙缝啊等等之类的。还是说增加数据也行,还有一直开着扭曲不会过拟合吗
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-21 18:51 , Processed in 0.144780 second(s), 40 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表