deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 691|回复: 2

关于batch size和泛化的问题

[复制链接]

3

主题

22

帖子

698

积分

高级丹师

Rank: 5Rank: 5

积分
698
 楼主| 发表于 2024-1-17 21:16:20 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
所谓的泛化和风格化是相反的吗?


那么batch size的介绍里说有助于神经网络的泛化, 那么我在训练一段时间之后开始关闭扭曲打开gan,面部风格等选项开始风格化训练, batch size是不是就可以适当取小以提高迭代速度?
回复

使用道具 举报

13

主题

527

帖子

3792

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3792
发表于 2024-1-18 10:23:14 | 显示全部楼层
①不是
②不是

PS:感觉LZ可能想问的是欠拟合和过拟合吧。
神经网络的泛化,是指我们的模型从给定数据中学习并将所学到的知识应用于其它地方的能力
那么,你希望它弱一点?
回复 支持 反对

使用道具 举报

2

主题

31

帖子

632

积分

高级丹师

Rank: 5Rank: 5

积分
632

万事如意节日勋章

发表于 2024-1-18 10:28:27 | 显示全部楼层
bs小会增加一个epoch里权重的更新速度,但更少的样本带来的是更不稳定的梯度,可能局部过拟合,也可能得到更尖锐更好的拟合效果。
bs大了则梯度会更稳定,但可能陷入局部最优,只管来说就是每张图片都要兼顾所以每张都学不好。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-23 10:29 , Processed in 0.123189 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表