1363989000 发表于 2024-4-26 19:36:36

分享一个JSY的2570万迭代Liae224-udt-wf-512-64-64-32模型

本帖最后由 1363989000 于 2024-4-26 19:37 编辑

之前讲过要利用新的DST(https://dfldata.cc/forum.php?mod=viewthread&tid=16742),杂图达36万张(有ffhq,金鱼全角度,老师图,二次元,AI图),不过正面居多
再训练一下之前帖子里的模型(https://dfldata.cc/forum.php?mod=viewthread&tid=16585)
最近闲着按liae的万能模型继续训练,在原来1920万的基础上(原始预训练丹是论坛了那个1290万的丹,丹的参数是滚石的400多W神丹的参数,之前在这个丹上训练了好几个专丹,最后迭代到1920万),
每80万左右(BS=8)重新扭曲后删除ab文件,五次共400万次迭代,
关闭扭曲不开gan训练了108万次(BS=20)
开gan0.03训练了28万次(BS=14)
开gan0.02训练了116万次(BS=14)
现在总共迭代了25702099次,也就是2570万次,整个过程断断续续应该有近2个月吧
模型是用ice版本练的,默认需要用ice版本载入,因为训练次数多,载入很慢,是正常现象,没去转换成正常的dfl版本,网友可以试试看转换会不会有问题


后面新切了一些AI绘图和二次元的图片做DST做测试,切脸,换脸(零训练),合成(遮罩用的镇坛之宝),用Topaz Photo AI 2.3.1软件进行增强分辨率
百度网盘:https://pan.baidu.com/s/1QFBR3H-XFQ270sHThlFrEg?pwd=1111 ,
解压密码我的用户名
该模型具体效果留给网友评判,
转成直播模型效果留给网友评判,
能不能复用,好不好复用留给网友评判
另,模型仅限于交流沟通,请勿用于任何非法用途





丹的参数如下:
模型架构: liae-udt
人脸类型: wf
模型分辨率: 224
自动编码器维度 ae_dims: 512
编码器维度 e_dims: 64
解码器维度 d_dims: 64
解码器掩码维度 d_mask_dims: 32
BS大小: 20
学习率lr: 5e-05
瘦化神经网络 lr_dropout: 开启
loss平滑: 开启
loss平滑强度: 3
遮罩约束训练范围: 开启
均衡侧脸训练权重: 开启
眼睛和嘴部优先: 开启
素材增强-翻转dst: 开启
GAN生成纹理细节强度: 0.02
GAN 结构识别器维度: 28
GAN 生成器的维度: 32
信仰优化器 adabelief: 开启
模型优化器放置于GPU: 开启
梯度剪裁: 开启








wangdaye 发表于 2024-4-27 03:07:10

本帖最后由 wangdaye 于 2024-4-27 03:16 编辑

你的精神值得点赞 其实吧 224真没必要这么狠训练 素材几十万 边学边忘 模型并不能 累计学到各种特征 所以练到2亿 也不一定比300万的更厉害 或有提升不大泛化就是个无底洞所以精简素材 针对睫毛 纹理 多训练 更好 可以适当练个更高点分辨率的模型 比如320 288 之类的效果会比224好很多

1363989000 发表于 2024-4-28 09:10:31

wangdaye 发表于 2024-4-27 03:07
你的精神值得点赞 其实吧 224真没必要这么狠训练 素材几十万 边学边忘 模型并不能 累计学到各种特征 所以练 ...

在练liae-udt-320wf-384-96-96-32,预训练了539W(也是36w杂图练的,bs8),在测试正训效果,感觉预训练丹效果一般,挺慢的,p40练320的太慢了,开bs8得1.8秒,后面改bs6,目前第一次扭曲中,到49W了,预计挂着正训到500W停止,到时候会再分享

wujingkaih 发表于 2024-4-26 20:02:05

还没下,请问下里面有训练好的DFM文件吗

tmpuser_01 发表于 2024-4-26 20:38:51

看起来不大聪明的样子

Pxhpanic 发表于 2024-4-26 21:42:24

好的丹有一个区间   不是越多越好

zhou041234 发表于 2024-4-26 22:14:45

能不能复用不清楚呗?

opklm1245 发表于 2024-4-27 01:56:45

dfl版本不能用吗 怎么转换成正常的dfl版本

DFLive 发表于 2024-4-27 07:11:01

wangdaye 发表于 2024-4-27 03:07
你的精神值得点赞 其实吧 224真没必要这么狠训练 素材几十万 边学边忘 模型并不能 累计学到各种特征 所以练 ...

320效果确实更好,用来换视频是不错的,不过跑deepfacelive的话普通显卡得干成PPT。

zhou041234 发表于 2024-4-27 09:36:30

wangdaye 发表于 2024-4-27 03:07
你的精神值得点赞 其实吧 224真没必要这么狠训练 素材几十万 边学边忘 模型并不能 累计学到各种特征 所以练 ...

我觉得可能是电脑只能跑224模型的,大点的配置不够了

少卿888 发表于 2024-4-27 10:27:50

页: [1] 2 3
查看完整版本: 分享一个JSY的2570万迭代Liae224-udt-wf-512-64-64-32模型