deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1576|回复: 1

FFHQ头像集-论坛用WF512补救包,去垃圾一键凑效!

[复制链接]

26

主题

334

帖子

2万

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
24811
 楼主| 发表于 2023-2-4 15:49:01 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 windjet 于 2023-9-20 19:07 编辑


补充一下:FFHQ头像集如下所示已经有了没垃圾的终极收藏版了,并且是三版本三集合 ,如果还没有下载过FFHQ头像集的,可以参考一下这个帖子,虽然贵一点,但总共有36万张共9个集合且质量更高,总体来说可能更划算。
https://dfldata.cc/forum.php?mod=viewthread&tid=14141
FFHQ终极收藏版-完整集女性集亚洲集-WF1024到256三版本三集合



大家可能都知道预训练最常用的头像集就是FFHQ头像集了,1024的高清分辨率,质量没得说,但也正是因为它的高质量,所以体积也大,它的原始包高达89.1 GB,估计让大部分人都望而生畏,因此,估计论坛里的很多人都是用的下面这位老兄做的WF512分辨率的合集来训练的。

https://dfldata.cc/forum.php?mod=viewthread&tid=9026
FFHQ DST 训练集 512 7万张


这位老兄努力为大家服务,真是辛苦了,为大家也包括我在内的确省了不少时间,在此表示感谢。
但有一个问题,就是这位老兄在切512脸后,产生了不少垃圾背景头像却没有做垃圾整理,如下图所示,这个补救包就是为了删除这些垃圾背景头像的。
FFHQ-Bad.jpg


大家可能会说,垃圾背景头像一般都会按尾部"_1","_2"等来排号,把它们删除不就得了,我开始也这么想,结果发现DFL不是那么聪明,很多的主角头像都排在"_0"之外,而不少垃圾背景头像倒是排在了"_0",如下图的主角就排在了"_2",错判的数量还不少,想利用DFL的自动排序查错来查找,实际操作发现也不理想。
52557-NG.png


因为保持预训练的高质量素材相当重要,我只好在利用工具的同时,再挨个对可疑文件仔细手动排查,浪费了不少时间,为了不让大家也重蹈旧辙,特此写了一个简单的脚本,做成了一个补救包,大家只要把原来的FFHQ头像集的"aligned"文件夹放同级目录,然后执行一下一键补救包的脚本就行了,不保证100%排错,但基本上是干净了,如果有漏网的垃圾头像,请告诉我。
执行后会把垃圾背景头像移入"aligned_bad"文件夹,并且会补充一部分中国美女头像到FFHQ里面使其正好凑够7万张头像。


这个文件处理操作脚本不会做任何删除或覆盖图片的处理,只有移动和拷贝处理,同名文件是自动略过不会覆盖的,所以对原图像集是安全的,请放心使用,以防万一,你也可以事先为原图像集做一个备份。
由于FFHQ本来就是高清图片,一部分垃圾背景头像也比较清晰,如果你觉得还可以用,也可以手动从"aligned_bad"里面把部分头像拷贝回"aligned"文件夹,补充的少数中国美女头像都在最后,不喜欢的话可以自己删除。


最后注意,这个FFHQ-论坛用WF512补救包只对上面帖子里面的FFHQ的WF512头像集了有效,你使用前得知道自己FFHQ头像集的确切来源,当然不是这个来源也不会造成什么特别后果,因为执行它是没有删除或覆盖图片的处理的,另外声明一下,本补救包不包含原FFHQ头像集。
(补救包里面有使用说明,执行前请仔细阅读使用说明后再进行操作!)

风擎,就是风之引擎。
回复

使用道具 举报

9

主题

82

帖子

555

积分

高级丹师

Rank: 5Rank: 5

积分
555
发表于 2024-2-15 22:45:00 | 显示全部楼层
大佬,我SRC视频切图后,得到3万多张图片      太多了
有没有一个小软件 什么的   可以处理一下SRC图片 (我刚学习,不会详细表达,见谅)
意思就是SRC图片太多了  训练的时候肯定时间很长吧   想把SRC里的图片删除一些   手工太麻烦了   有没有什么软件或者方法可以快速处理的  
麻烦回复一下  ,谢谢   
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-5-18 20:39 , Processed in 0.090779 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表