我心态崩了这多买得显卡有毛用？？？？？

MLGB · 发表于 2024-8-15 13:00:43

星级打分

1
2
3
4
5

平均分:NAN 参与人数:0 我的评分:未评

本帖最后由 MLGB 于 2024-8-15 15:54 编辑

再论坛内各位佬的教导下，第一次的专人丹训练非常成功。于是现在开始了折腾和进阶。
专人NO，这次要万能的。

总体规划：
   1.找个丹，这次选择论坛的 320-384-96-96-32 底丹 https://dfldata.cc/forum.php?mod ... E5%B7%B2%E5%88%A0ab
   2.src-src训练，先训练大角度极端角度的src（2-4步骤预计总训练24小时）
   3.src-src训练，再训练小角度正脸角度的src（2-4步骤预计总训练24小时）
   4.src-src训练，合并大小角度训练（2-4步骤预计总训练24小时）
   5.dst-src训练，正式训练过程：看情况1天1次删除ab 删除4次左右，等待清晰。（骤预计总训练5*24小时）
   6.dst-scr训练，开gan 训练1天，拿丹


配置信息：
RTX3090 4卡
内存 120G

过程记录1：（此过程bs12 用了1张卡）
找出大角度图片2000张，分别放入src-dst中，进行训练，嘴眼，扭曲，遮罩开起来干就行，9个小时后,吆，还不错哦，清晰即可，没太关注损失大概也就是0.3一下

过程记录2：（此过程bs12 用了1张卡）
找出小角度图片2000张，分别放入src-dst中，进行训练，嘴眼，扭曲，遮罩开起来干就行，9个小时后,吆，效果也还不错哦，清晰即可，没太关注损失大概也就是0.3一下

过程记录3：（此过程bs12 用了1张卡）
合并大小角度素材4600张，分别放入src-dst中，进行训练，嘴眼，扭曲，遮罩开起来干就行，12个小时后,吆，效果还行，刚启动的时候值有点高，不过12个小时过去也都降到3了，睡醒了一看就停了。

过程记录4: bs 48   4卡全开
在轮胎找了个亚洲人脸数据集各种拼凑把搞了2万张dst素材，我看素材尺寸又的512有的768的，也没管，直接写入遮罩。
目前DST 2万亚洲人脸，SRC 4600张模特素材
开始训练眼嘴优先  侧脸样本优先  遮罩遮罩边缘都打开  学习率打开  DST反转随机色调0.1 颜色RCT
这速度有点吓人，有时候3秒有时候18秒  有时候1分的，管他娘的  干就行了（啦啦啦啦啦啦）

后续我会继续发

开始崩了，我特么得以为多买点显卡能加快训练速度啊我靠这特么得加快个P 测试了下 BS越大越慢，BS小我1张卡都行要4张干啥，这么慢得训练速度

哎一开始啥也不懂上来就想弄全弄高弄好可惜我特么得但凡是能买1个练一下啊，也不至于这样啊

seancai110 · 发表于 2024-8-15 16:07:56

batchsize大，只是让训练更加平滑，减少梯度下降的抖动。

如果bs太大，会出现的问题是显卡训练完了，cpu还没准备好数据。这时候显卡会不断向cpu发出信息，打断cpu准备数据，造成迭代速度变慢。在资源管理器上看，就是cuda的占用是一堆尖三角，而不是一条稳定的直线。

还有一点，bs最好不要选4的倍数或者2的幂，容易出现缓存冲突。bs加1或减1反倒速度变快。

还是那句话，lz你可能会代码，但是不会神经网络。。

avtopalang · 发表于 2024-8-15 16:47:48

别肾上腺素爆发就狂整。如果真的玩换脸，找个大显存的电脑好好训练模型，别听什么速成的。什么正训一两天就能成，那是扯淡，你随便丢个樱花去试试，一两天狗毛都不是。也别迷信什么模特素材的，那才能拍几个人的？泛化性练不好，有啥用？再随便整个电脑下载整理素材，另外再弄个电脑合成剪辑。三电脑足够玩了。

GRXSG · 发表于 2024-8-15 13:07:57

牛逼

takisu88975 · 发表于 2024-8-15 14:37:10

这是谁的素材啊

takisu88975 · 发表于 2024-8-15 14:38:49

takisu88975 发表于 2024-8-15 14:37
这是谁的素材啊

明星还是网红

pasanonic · 发表于 2024-8-15 15:34:47

本帖最后由 pasanonic 于 2024-8-15 15:38 编辑

牛逼啊噘嘴都这么6
多显卡运行方式（论坛搜的）

在你运行训练程序的时候一开始会让你输入模型名称，然后会有个显卡选择，单卡可能一般选择0 帖子里 5卡应该是分别对应的是0,1,2,3,4 中文输入法逗号不行，在选择显卡的时候，用英文，是英文逗号隔开就可以了，我是三卡，就是是0,1,2 多卡的好处就是BATH SIZE可以提高，我三个老卡，显存是3G 3 G 6G我跑的是低配的224那个，BATCH可以开到26 ，但是好像，好像是其他参数无法叠加，用GPU-Z看显存和核心占用三个卡都是满的，但是BATCH SIZE的意义是啥？因人而异。batch size 大了，你完成相同迭代的时间反而长了，但是曲线下降的速度快了，但是当曲线下降到一定阶段以后，这种优势又没有了，所以得找到一个合适的设置，并不是越小越好也不是越大越好，还有三卡的话，提取脸有提速。

MLGB · 发表于 2024-8-15 15:41:41

pasanonic 发表于 2024-8-15 15:34
牛逼啊噘嘴都这么6
多显卡运行方式（论坛搜的）

多卡跑起来了但是速度废了！！！可能我CPU不行？反正 BS越大越慢

wd8df · 发表于 2024-8-15 15:58:09

不浪费吧，肯定又不是只玩这一个AI，显卡出手也折不了多少

pasanonic · 发表于 2024-8-15 16:00:40

本帖最后由 pasanonic 于 2024-8-15 16:03 编辑

MLGB 发表于 2024-8-15 15:41
多卡跑起来了但是速度废了！！！可能我CPU不行？反正 BS越大越慢

cpu确实会拖后腿有人云端测试过
你有小核吗？
试试这个方法
https://dfldata.cc/forum.php?mod ... id=19051&extra=

MLGB · 发表于 2024-8-15 16:23:16

seancai110 发表于 2024-8-15 16:07
batchsize大，只是让训练更加平滑，减少梯度下降的抖动。

如果bs太大，会出现的问题是显卡训练完了，cpu还 ...

我服务器得CPU都很古老了，目前来说只能换CPU了啊我研究下买点CPU 跟上

谢谢你

		自动登录	找回密码
密码			立即注册（仅限QQ邮箱）

我心态崩了这多买得显卡有毛用？？？？？

评分

万事如意节日勋章

开心娱乐节日勋章

我心态崩了 这多买得显卡有毛用？？？？？

评分

万事如意节日勋章

开心娱乐节日勋章

我心态崩了这多买得显卡有毛用？？？？？