deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 703|回复: 25

请教,练万能丹第一步BS开4,一定要这样吗?

[复制链接]

1

主题

15

帖子

387

积分

初级丹师

Rank: 3Rank: 3

积分
387
 楼主| 发表于 2024-7-10 11:50:14 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
只是为了加快“速度”?

还是说因为BS4比更高的“效果”要好?

因为我这里开不了纯GPU模式,显存不够,需要开CPU兼容模式
然后我发现CPU兼容模式的BS大小和总效率并不是直线关系
也就是说BS开得越高,总效率就越大
举个例子BS4可能迭代是2000ms,而BS6可能只是2200ms,BS8可能只是2400ms(可能因为数据在交换中占据了很多时间)

所以如果BS4只是为了“快”
那我就把BS开到最大
而BS4如果是“最优”
那我就还把BS开到4
回复

使用道具 举报

10

主题

2460

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
13310

真我风采勋章万事如意节日勋章

发表于 2024-7-10 13:31:15 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-7-10 13:44 编辑

低BS意味着,随机抽选的图片分散。意思是,尽量点名不重复的图。
高BS意味着,点名只集中在少量图身上(少部分图,被不断重复点名)。

BS 1为全部图轮流点,大于1的,就是全部的几分之一。
比如BS 4,集中点名全部图的4分1,BS 8为集中点名全部图的8分之1,BS越高,练不到的图越多类推。
几分之几不一定准,但意思是差不多的,BS越高,选图点名就越集中越重复。
看上面黄蓝曲线比较直观,BS越高,曲线幅度越窄
根据目的需求,自己选择。


评分

参与人数 1贡献 +1 收起 理由
WaveBedo + 1 感谢分享

查看全部评分

回复 支持 3 反对 0

使用道具 举报

10

主题

2460

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
13310

真我风采勋章万事如意节日勋章

发表于 2024-7-10 15:32:13 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-7-10 15:33 编辑
tianyuansnow 发表于 2024-7-10 15:28
谢谢解答,也就是说BS数值的区别体现在点名规则上

那么排除点名集中这一因素,训练效率是否约等于 BS数 ...

点名集中,练不到的图(模糊的),一般需要单独练第二遍。
当然,你也可以不管,会影响部分角度的效果。
高低BS,只是倾向不同,是先集中一部分,还是直接比较均衡,看自己的选择。
总体耗时与效率上,大体是一样的。
回复 支持 1 反对 1

使用道具 举报

1

主题

15

帖子

387

积分

初级丹师

Rank: 3Rank: 3

积分
387
 楼主| 发表于 2024-7-10 15:28:38 | 显示全部楼层
本帖最后由 tianyuansnow 于 2024-7-10 15:31 编辑
wtxx8888 发表于 2024-7-10 13:31
低BS意味着,随机抽选的图片分散。意思是,尽量点名不重复的图。
高BS意味着,点名只集中在少量图身上(少 ...

谢谢解答,也就是说BS数值的区别体现在点名规则上

那么排除点名集中这一因素,训练效率是否约等于 BS数值÷迭代时间

我的意思是如果我用更多的时间,应该就可以抹平集中点名的规则

毕竟这个问题在GPU模式下并不存在,因为GPU模式随着BS的改变,迭代周期也成比例的改变,所以训练效率都差不多
但是CPU兼容模式,几乎就是BS越大训练效率越高……
回复 支持 反对

使用道具 举报

1

主题

15

帖子

387

积分

初级丹师

Rank: 3Rank: 3

积分
387
 楼主| 发表于 2024-7-10 17:32:41 | 显示全部楼层
wtxx8888 发表于 2024-7-10 13:31
低BS意味着,随机抽选的图片分散。意思是,尽量点名不重复的图。
高BS意味着,点名只集中在少量图身上(少 ...

再次感谢
回复 支持 反对

使用道具 举报

38

主题

721

帖子

5020

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5020

万事如意节日勋章开心娱乐节日勋章

发表于 2024-7-11 01:12:26 | 显示全部楼层
wtxx8888 发表于 2024-7-10 13:31
低BS意味着,随机抽选的图片分散。意思是,尽量点名不重复的图。
高BS意味着,点名只集中在少量图身上(少 ...

如果使用loss平滑,是不是解决这个问题?
不用bs4也没有关系?可以全程高bs?
回复 支持 反对

使用道具 举报

10

主题

2460

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
13310

真我风采勋章万事如意节日勋章

发表于 2024-7-11 11:22:56 | 显示全部楼层
WaveBedo 发表于 2024-7-11 01:12
如果使用loss平滑,是不是解决这个问题?
不用bs4也没有关系?可以全程高bs? ...

高LOSS专训,并不能均衡,实测一样有练不到的。

评分

参与人数 1贡献 +1 收起 理由
WaveBedo + 1 好的

查看全部评分

回复 支持 反对

使用道具 举报

2

主题

41

帖子

390

积分

初级丹师

Rank: 3Rank: 3

积分
390

万事如意节日勋章

发表于 2024-7-11 23:27:14 | 显示全部楼层
wtxx8888 发表于 2024-7-10 13:31
低BS意味着,随机抽选的图片分散。意思是,尽量点名不重复的图。
高BS意味着,点名只集中在少量图身上(少 ...

批量大小抽取的是同一个角度的吗? 比如BS1抽中“左转20度抬头10度”这个格子里的一张图,BS8是抽这个格子里的8张图,  还是会抽到其他角度的图
回复 支持 反对

使用道具 举报

10

主题

2460

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
13310

真我风采勋章万事如意节日勋章

发表于 2024-7-12 00:11:59 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-7-12 00:15 编辑
roy777 发表于 2024-7-11 23:27
批量大小抽取的是同一个角度的吗? 比如BS1抽中“左转20度抬头10度”这个格子里的一张图,BS8是抽这个格 ...

估计是比较接近的图,反正BS高了,随便刷新两下,就能看见模糊的图。
BS比较低时,比如4,刷新一般都差不多的模糊程度,意味着练的比较均衡。
不像高BS,刷新就是一部分图很清晰,一部分一塌糊涂
回复 支持 反对

使用道具 举报

7

主题

78

帖子

851

积分

高级丹师

Rank: 5Rank: 5

积分
851
发表于 2024-7-13 21:56:29 | 显示全部楼层
wtxx8888 发表于 2024-7-12 00:11
估计是比较接近的图,反正BS高了,随便刷新两下,就能看见模糊的图。
BS比较低时,比如4,刷新一般都差 ...

请问,看到的模糊的图,是不是就是没有训练到的?那么BS值开多大最有性价比呢?
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-8 08:22 , Processed in 0.115073 second(s), 15 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表