deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1062|回复: 20

我心态崩了 这多买得显卡有毛用?????

[复制链接]

39

主题

202

帖子

2631

积分

初级丹圣

Rank: 8Rank: 8

积分
2631
 楼主| 发表于 2024-8-15 13:00:43 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 MLGB 于 2024-8-15 15:54 编辑

再论坛内各位佬的教导下,第一次的专人丹训练非常成功。于是现在开始了折腾和进阶。
专人NO,这次要万能的。

总体规划:
     1.找个丹,这次选择论坛的 320-384-96-96-32 底丹    https://dfldata.cc/forum.php?mod ... E5%B7%B2%E5%88%A0ab
     2.src-src训练,先训练大角度极端角度的src(2-4步骤预计总训练24小时)
     3.src-src训练,再训练小角度正脸角度的src(2-4步骤预计总训练24小时)
     4.src-src训练,合并大小角度训练(2-4步骤预计总训练24小时)
     5.dst-src训练,正式训练过程:看情况1天1次删除ab 删除4次左右,等待清晰。(骤预计总训练5*24小时)
     6.dst-scr训练,开gan 训练1天 ,拿丹
     
     
配置信息:
    RTX3090 4卡
    内存 120G


过程记录1:(此过程bs12 用了1张卡)
    找出大角度图片2000张,分别放入src-dst中,进行训练,嘴眼,扭曲,遮罩开起来干就行,9个小时后,吆,还不错哦,清晰即可,没太关注损失大概也就是0.3一下
   
    14caa3d0c55f40451a101398dae9af8.png db9484984ebd608f11d5b8e84e4923d.png
   
   
过程记录2:(此过程bs12 用了1张卡)
    找出小角度图片2000张,分别放入src-dst中,进行训练,嘴眼,扭曲,遮罩开起来干就行,9个小时后,吆,效果也还不错哦,清晰即可,没太关注损失大概也就是0.3一下
   
    bc6d3d3885a9e7cd871e387f8096a51.png 7744d8784b3adbe968a11d6991e8b18.png 3c2eddb28eaf985d5c2a324b308e3d4.png
   

过程记录3:(此过程bs12 用了1张卡)
    合并大小角度素材4600张,分别放入src-dst中,进行训练,嘴眼,扭曲,遮罩开起来干就行,12个小时后,吆,效果还行,刚启动的时候值有点高,不过12个小时过去也都降到3了,睡醒了一看就停了。
    1601661f73ea013eb619e6e95fd8212.png 0408f092f91dda19c41e51a748cac7f.png e696dbc8d506544056380d2af25f8ad.png bd6914609c7306823887ce5b4837a04.png
   
过程记录4: bs 48   4卡全开
    在轮胎找了个亚洲人脸数据集各种拼凑把搞了2万张dst素材,我看素材尺寸又的512有的768的,也没管,直接写入遮罩。
    目前DST 2万亚洲人脸,SRC 4600张模特素材
    开始训练   眼嘴优先  侧脸样本优先  遮罩 遮罩边缘都打开  学习率打开  DST反转 随机色调0.1 颜色RCT
    这速度 有点吓人, 有时候3秒 有时候18秒  有时候1分的,管他娘的  干就行了(啦啦啦啦啦啦)
image.png 8b73fa6dec1ce41ce68e0d74e5c5cead.jpeg image.png




后续我会继续发


开始崩了,我特么得以为多买点显卡能加快训练速度啊  我靠 这特么得 加快个P  测试了下  BS越大越慢,BS小 我1张卡都行   要4张干啥,这么慢得训练速度  

哎  一开始啥也不懂 上来就想弄全 弄高 弄好  可惜我特么得但凡是能买1个练一下啊,也不至于这样啊  

回复

使用道具 举报

13

主题

1038

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12438
发表于 2024-8-15 16:07:56 | 显示全部楼层
batchsize大,只是让训练更加平滑,减少梯度下降的抖动。

如果bs太大,会出现的问题是显卡训练完了,cpu还没准备好数据。这时候显卡会不断向cpu发出信息,打断cpu准备数据,造成迭代速度变慢。在资源管理器上看,就是cuda的占用是一堆尖三角,而不是一条稳定的直线。

还有一点,bs最好不要选4的倍数或者2的幂,容易出现缓存冲突。bs加1或减1反倒速度变快。

还是那句话,lz你可能会代码,但是不会神经网络。。

评分

参与人数 1贡献 +1 收起 理由
WaveBedo + 1 十分给力!

查看全部评分

回复 支持 2 反对 0

使用道具 举报

3

主题

50

帖子

856

积分

高级丹师

Rank: 5Rank: 5

积分
856
发表于 2024-8-15 16:47:48 | 显示全部楼层
别肾上腺素爆发就狂整。如果真的玩换脸,找个大显存的电脑好好训练模型,别听什么速成的。什么正训一两天就能成,那是扯淡,你随便丢个樱花去试试,一两天狗毛都不是。也别迷信什么模特素材的,那才能拍几个人的?泛化性练不好,有啥用?再随便整个电脑下载整理素材,另外再弄个电脑合成剪辑。三电脑足够玩了。
回复 支持 1 反对 0

使用道具 举报

0

主题

14

帖子

283

积分

初级丹师

Rank: 3Rank: 3

积分
283
发表于 2024-8-15 13:07:57 | 显示全部楼层
牛逼
回复

使用道具 举报

2

主题

69

帖子

390

积分

初级丹师

Rank: 3Rank: 3

积分
390
发表于 2024-8-15 14:37:10 | 显示全部楼层
这是谁的素材啊
回复 支持 反对

使用道具 举报

2

主题

69

帖子

390

积分

初级丹师

Rank: 3Rank: 3

积分
390
发表于 2024-8-15 14:38:49 | 显示全部楼层

明星还是网红
回复 支持 反对

使用道具 举报

40

主题

801

帖子

4304

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4304

万事如意节日勋章

发表于 2024-8-15 15:34:47 | 显示全部楼层
本帖最后由 pasanonic 于 2024-8-15 15:38 编辑

牛逼啊  噘嘴都这么6
多显卡运行方式(论坛搜的)
在你运行训练程序的时候一开始会让你输入模型名称,然后会有个显卡选择,单卡可能一般选择0     帖子里 5卡应该是分别对应的是0,1,2,3,4  中文输入法逗号不行,在选择显卡的时候, 用英文,是英文逗号隔开就可以了,我是三卡,就是是0,1,2 多卡的好处就是BATH SIZE可以提高,我三个老卡,显存是3G 3 G 6G我跑的是低配的224那个,BATCH可以开到26 ,但是好像,好像是其他参数无法叠加,用GPU-Z看显存和核心占用三个卡都是满的,但是BATCH SIZE的意义是啥?因人而异。batch size 大了,你完成相同迭代的时间反而长了,但是曲线下降的速度快了,但是当曲线下降到一定阶段以后,这种优势又没有了,所以得找到一个合适的设置,并不是越小越好也不是越大越好,还有三卡的话,提取脸有提速。

回复 支持 反对

使用道具 举报

39

主题

202

帖子

2631

积分

初级丹圣

Rank: 8Rank: 8

积分
2631
 楼主| 发表于 2024-8-15 15:41:41 | 显示全部楼层
pasanonic 发表于 2024-8-15 15:34
牛逼啊  噘嘴都这么6
多显卡运行方式(论坛搜的)

多卡 跑起来了  但是 速度废了!!!  可能我CPU不行?  反正 BS越大越慢  
回复 支持 反对

使用道具 举报

4

主题

42

帖子

551

积分

高级丹师

Rank: 5Rank: 5

积分
551
发表于 2024-8-15 15:58:09 | 显示全部楼层
不浪费吧,肯定又不是只玩这一个AI,显卡出手也折不了多少
回复 支持 反对

使用道具 举报

40

主题

801

帖子

4304

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4304

万事如意节日勋章

发表于 2024-8-15 16:00:40 | 显示全部楼层
本帖最后由 pasanonic 于 2024-8-15 16:03 编辑
MLGB 发表于 2024-8-15 15:41
多卡 跑起来了  但是 速度废了!!!  可能我CPU不行?  反正 BS越大越慢

cpu确实会拖后腿  有人云端测试过
你有小核吗?
试试这个方法
https://dfldata.cc/forum.php?mod ... id=19051&extra=

回复 支持 反对

使用道具 举报

39

主题

202

帖子

2631

积分

初级丹圣

Rank: 8Rank: 8

积分
2631
 楼主| 发表于 2024-8-15 16:23:16 | 显示全部楼层
seancai110 发表于 2024-8-15 16:07
batchsize大,只是让训练更加平滑,减少梯度下降的抖动。

如果bs太大,会出现的问题是显卡训练完了,cpu还 ...

我服务器得CPU都很古老了,目前来说只能换CPU了啊  我研究下   买点CPU  跟上  

谢谢你
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-10-25 01:32 , Processed in 0.116276 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表