deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 881|回复: 12

专丹训练问题

[复制链接]

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-6 21:21:41 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 jim2222 于 2024-4-6 21:23 编辑

dst用的几万张各种不同类型的杂图,开扭曲训练了十几万次预览第五列已经很像了,想试下效果换了dst结果一点也不像怎么回事。我之前也训练过另一个人的模型效果就相当不错,基本不管换什么新的dst哪怕不用训练直接合成都很像,有大神知道原因吗?用的都是自闭2.0的模型
回复

使用道具 举报

15

主题

1921

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27029

万事如意节日勋章

发表于 2024-4-6 21:32:39 | 显示全部楼层
从零训练的吗,扭曲十几万。src loss多少了
回复 支持 反对

使用道具 举报

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-6 21:50:52 | 显示全部楼层
come3002 发表于 2024-4-6 21:32
从零训练的吗,扭曲十几万。src loss多少了

src 0.2几 dst比较高0.7吧 但是训练时看第五列已经比较像了
回复 支持 反对

使用道具 举报

15

主题

1921

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27029

万事如意节日勋章

发表于 2024-4-6 23:14:15 | 显示全部楼层
本帖最后由 come3002 于 2024-4-6 23:17 编辑
jim2222 发表于 2024-4-6 21:50
src 0.2几 dst比较高0.7吧 但是训练时看第五列已经比较像了

自闭2.0 底单用的素材质量高的时候。你的dst质量一般,loss会容易远远高于src。
第四列模糊,跟第二列清晰度差距,可能会影响泛化能力。

建议1:减少 DST数量。把几万张杂图,先分成多组,第一批先放入1000-5000杂图。
建议2:提高DST质量。可以精选做第一批,精选时候优先去模糊,并选择质量高一点,胡须比较少(胡须多loss比较高)优质DST等。

等有了好的基础了。第二批 第三批 依次dst loss会降低的比较快。
回复 支持 反对

使用道具 举报

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-7 11:06:16 | 显示全部楼层
come3002 发表于 2024-4-6 23:14
自闭2.0 底单用的素材质量高的时候。你的dst质量一般,loss会容易远远高于src。
第四列模糊,跟第二列清晰 ...

好的我试试
回复 支持 反对

使用道具 举报

15

主题

1921

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27029

万事如意节日勋章

发表于 2024-4-7 11:38:05 | 显示全部楼层
本帖最后由 come3002 于 2024-4-7 11:43 编辑

dfl实质是图像转换软件。底单用了SRC质量高,DST质量高。
情景一:假设你用的是SRC质量高(接近底单训练者水平),DST质量一般。随着你开随机扭曲,几乎是覆写了以前的优质DST信息。既dst loss降低的慢,也效率比较低。
情景二:如果复用时候,你的SRC质量高
(接近底单训练者的水平),DST也精选质量高(接近底单训练者的水平),那么loss掉的快,出你想要的结果也相对比较快。


我测试用352模型分辨率,用质量高的src和一般的DST训练效果不佳。
当改用用质量高的SRC和精选质量高的DST,训练效果比较好。
4k 2160近景   
352模型分辨率dfudt
360截图20240406205435808.jpg
睫毛测试3.jpg

合成开T,左边结果,右边原版。
睫毛合成.jpg
放大能看到4k近景,人脸看到 4根以上长睫毛(上传论坛有压缩)
基本满足4k近景需求。
360截图20240406212303167.jpg


回复 支持 反对

使用道具 举报

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-7 15:19:04 | 显示全部楼层
come3002 发表于 2024-4-7 11:38
dfl实质是图像转换软件。底单用了SRC质量高,DST质量高。
情景一:假设你用的是SRC质量高(接近底单训练者 ...

src是选择从直播之类视频截取大量光影妆容相似度高的素材 还是各种不同时期类型的照片效果好呢
回复 支持 反对

使用道具 举报

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-7 15:30:28 | 显示全部楼层
come3002 发表于 2024-4-7 11:38
dfl实质是图像转换软件。底单用了SRC质量高,DST质量高。
情景一:假设你用的是SRC质量高(接近底单训练者 ...

我之前的用是自己从几十部片里每部截取几百张总共大概3万张作为专丹dst训练素材,src用直播这种相似度比较高的素材或则数量比较少几百张照片进行训练其实效果还不错,但是如果用几千张复杂度比较高的进行训练就怎么练都不像,然后我就想是不是dst选的太少了就用论坛里下的那种几万张杂图训练,结果训练是比较像了但是dst loss降不下去泛化很差
回复 支持 反对

使用道具 举报

2

主题

38

帖子

1233

积分

初级丹圣

Rank: 8Rank: 8

积分
1233
 楼主| 发表于 2024-4-7 15:33:33 | 显示全部楼层
come3002 发表于 2024-4-7 11:38
dfl实质是图像转换软件。底单用了SRC质量高,DST质量高。
情景一:假设你用的是SRC质量高(接近底单训练者 ...

我总结就是src数量少或者用直播这种相似度很高的训练起来其实效果比较好训练也快,一旦你的src数量过多反而难训练
回复 支持 反对

使用道具 举报

15

主题

1921

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27029

万事如意节日勋章

发表于 2024-4-7 15:40:20 | 显示全部楼层
jim2222 发表于 2024-4-7 15:19
src是选择从直播之类视频截取大量光影妆容相似度高的素材 还是各种不同时期类型的照片效果好呢 ...

SRC还是各种不同时期类型的照片效果好呢

=======================
SRC 切脸可以看梦版主的贴子,推荐从一部剧 古装剧/电影/一场直播做主体,极少量用其他来源像几张写真补充来光影啊,角度啊。这样妆容一致为主体,SRC loss降低的比较快。
来源太多,太复杂了。需要大量的迭代。耗费很大算力。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-23 03:37 , Processed in 0.129538 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表