14
3380
1万
高级丹圣
wuzhicom107 发表于 2024-7-13 21:56 请问,看到的模糊的图,是不是就是没有训练到的?那么BS值开多大最有性价比呢? ...
使用道具 举报
7
98
1459
初级丹圣
wtxx8888 发表于 2024-7-13 22:34 。。。没有无脑,只有视情况而定。 波浪式,前期低BS,中期高BS,后期低BS.
wuzhicom107 发表于 2024-7-13 22:46 哦哦,谢谢解答。刚刚百度了一下,看到一篇专门讲BS值对神经网络训练的影响。 BS值的大小和你讲解的差不 ...
wtxx8888 发表于 2024-7-13 22:50 额,DFL的LRD(learning rate dropout)正确翻译应该是抛弃式学习。 意为用空数据替代图像,从而快速略过 ...
wtxx8888 发表于 2024-7-13 23:01 原版没给学习率的控制,你就前期小BS(4),跑个5到10万迭代。 然后极限BS(显卡不炸显存)一直跑到目标LOS ...
wuzhicom107 发表于 2024-7-14 15:19 你好,请问一个问题 假如我的DST练了一段时间后换了新的DST继续练 过一阵又把之前的DST拿回来炼,MODEL会 ...
wtxx8888 发表于 2024-7-14 15:59 会比第一次的速度快,但不等于直接回到第一次的状态。 意思是需要重新练一阵,才能恢复到之前的状态。 所 ...
wuzhicom107 发表于 2024-7-14 16:53 明白了,那假如自己从头练的话,也需要留一个练好的底丹 免得练好了的丹越来越差,最后废了 还好问一下, ...
敢于展现自我风采,秀出青春年华的会员
年年顺景胜人意,日日兴隆通四海
|Archiver|手机版|deepfacelab中文网 |网站地图
GMT+8, 2025-6-8 09:28 , Processed in 0.110843 second(s), 28 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.