deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 5655|回复: 43

【deepfacelab专用】src图片切脸后批量人脸去重脚本软件

  [复制链接]

13

主题

130

帖子

4404

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4404
 楼主| 发表于 2022-10-8 23:20:38 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:5  参与人数:2  我的评分:未评
本帖最后由 刺猬粑粑 于 2022-10-27 22:07 编辑

自己写的图片去重脚本,主要适用于切完src脸之后,发现太多重复图片时,用来去重,具体看图吧


[ ============================ ]
[  图片去重工具v.1.0.1 by 刺猬粑粑 ]
[ dfldata.xyz【论坛专用】 ]
     _  __ _     _       _
        | |/ _| |   | |     | |
      __| | |_| | __| | __ _| |_ __ _  __  ___   _ ____
     / _` |  _| |/ _` |/ _` | __/ _` | \ \/ / | | |_  /
    | (_| | | | | (_| | (_| | || (_| |_ >  <| |_| |/ /
     \__,_|_| |_|\__,_|\__,_|\__\__,_(_)_/\_\\__, /___|
                                              __/ |
                                             |___/
[ ============================ ]
[ 本工具作用:该工具主要用于src图片去重 ]
[ 切src头像图片后,因为每帧可能会切好几张,导致重复图片过多,过多重复图片会给训练增加负担 ]
[ 注意事项:只适用于处理src重复图片的筛选移除 ]
[ ============================ ]
[ 使用说明: ]
[ 1.输入人脸图片的路径,如D:/人脸图片路径  ]
[ 2.选择模式,1 懒散模式(推荐),2 精细模式。 实际算法不同 相差不大]
[ 3.比如a,b图片90%一样,但是可能有些细节,比如眼神看的方向是不一样的  ]
[   精细模式会认为这是两张不同图片选择保留,而懒散模式会认为这两张图片相同,会选择删除后一张图片  ]
[ 4.被移除的图片会保存在上面输入的目录下的delete文件夹中。 ]
[ 5.源码开放,报毒的话那就是杀毒软件有病!!! ]
[ ============================ ]


注意:解压得到脚本文件夹后,需要放到DeepFaceLab下的_internal文件夹中,1点击安装依赖的包 2执行去重的那个bat。

这里用到两种图片相似度的去重算法,理论上 模式二速度快更精确。但是实际使用中 我发现其实两种都差不多

不保证极致精准 但是能绝对帮你省下不少眼力和手力劳动且不会误删图片,特别是src素材切脸后有几万张+的时候,会存在大量重复图片

image.png

image.png



image.png

image.png


image.png
image.png

使用教程上图看不明白可以看b站视频



使用建议:只追求人脸图片角度就用1.懒散模式,该模式处理速度更快,追求保留人脸角度和表情、眼神等细节的 就用2.精细模式
用过的朋友都说好用

使用后问题和建议可以在评论区讨论下 自己花几小时手写的 赚点灵石
网盘链接(长期有效。论坛网盘插件失效是误报):https://pan.baidu.com/s/1pERtX8O8YS7p98RF9O3jZA





评分

参与人数 1贡献 +1 收起 理由
labels + 1 很给力!

查看全部评分

回复

使用道具 举报

13

主题

130

帖子

4404

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4404
 楼主| 发表于 2022-10-8 23:40:55 | 显示全部楼层
滚石 发表于 2022-10-8 23:27
去重原理是什么?

我用的是通过图片哈希值计算的方式

目前有几种图片hash值的计算方法:
平均哈希算法 aHash:平均值哈希。速度比较快,但是常常不太精确。
感知哈希算法 pHash:感知哈希。精确度比较高,但是速度方面较差一些。
差异值哈希算法 dHash:差异值哈希。精确度较高,且速度也非常快

这个脚本用到了如上的aHash和dHash

1. 平均哈希算法(aHash):

该算法是基于比较灰度图每个像素与平均值来实现。

2.差异值哈希算法(dHash):

相比pHash,dHash的速度要快的多,相比aHash,dHash在效率几乎相同的情况下的效果要更好,它是基于渐变实现的。
回复 支持 1 反对 0

使用道具 举报

216

主题

1998

帖子

68万

积分

管理员

Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96

积分
687902

隐世金马甲勋章超级版主勋章可爱萌新勋章见习版主勋章荣誉会员勋章男同管理员-无尚荣耀勋章优质版主勋章小有贡献勋章

发表于 2022-10-8 23:27:59 | 显示全部楼层
去重原理是什么?
提供数字人直播服务、文字/音频驱动数字人服务,有意者联系我QQ563861181
全站默认解压密码dfldata.xyz
DFL交流QQ群五群974612885
AI绘画交流QQ群710238550
我的B站账号:特看科技的滚石   其他自称彦祖的不是我,请勿上当
回复 支持 反对

使用道具 举报

10

主题

454

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11470

可爱萌新勋章荣誉会员勋章小有贡献勋章

发表于 2022-10-9 10:33:58 | 显示全部楼层
其实这种算法的去重已经有现成的gui软件了,我之前也自己写过这个算法,但发现有个问题,就是对眼神眼珠子的判别不敏感。同角度同表情不同方向眼珠子的素材对专丹的训练也是很重要的
回复 支持 反对

使用道具 举报

13

主题

130

帖子

4404

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4404
 楼主| 发表于 2022-10-9 10:49:25 | 显示全部楼层
Hedwig 发表于 2022-10-9 10:33
其实这种算法的去重已经有现成的gui软件了,我之前也自己写过这个算法,但发现有个问题,就是对眼神眼珠子 ...

是的,这里的dhash算法已经其实很细了,而且我用的是100%相似度才会认为是重复并且是把重复移动到别的文件夹而不是直接删了,也是怕出现误删的情况。就好比用mve也可以可视化找出肉眼看着相同的进行手动删除,但是确实费眼睛费精力,哈哈
回复 支持 反对

使用道具 举报

0

主题

9

帖子

58

积分

高级丹童

Rank: 2

积分
58
发表于 2022-10-9 12:38:17 | 显示全部楼层
切src人脸,一帧就切好几张,很多时候都是一模一样的图片。。。大佬这个脚本看着应该很受用,攒够灵石必买
回复 支持 反对

使用道具 举报

13

主题

130

帖子

4404

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4404
 楼主| 发表于 2022-10-9 12:46:40 | 显示全部楼层
初入魔坛 发表于 2022-10-9 12:38
切src人脸,一帧就切好几张,很多时候都是一模一样的图片。。。大佬这个脚本看着应该很受用,攒够灵石必买 ...

感谢支持  是的 我做这个初衷也是因为遇到你说的情况,这个还是能省不少时间和精力的,人工太费眼了
回复 支持 反对

使用道具 举报

0

主题

3

帖子

36

积分

初级丹童

Rank: 1

积分
36
发表于 2022-10-9 13:47:04 | 显示全部楼层
谢谢分享
回复

使用道具 举报

9

主题

797

帖子

4265

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4265
发表于 2022-10-9 14:46:12 | 显示全部楼层
是怎么判断两张照片重复相似度的?
回复 支持 反对

使用道具 举报

0

主题

9

帖子

58

积分

高级丹童

Rank: 2

积分
58
发表于 2022-10-9 15:22:47 | 显示全部楼层
本帖最后由 初入魔坛 于 2022-10-9 15:25 编辑

根据前面楼主介绍的原理,获取图片哈希值进行计算,我去百度了下,好像有一点点了解了,哈哈,不懂装懂一会儿
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-23 13:02 , Processed in 0.148867 second(s), 42 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表