deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1341|回复: 20

src全明星训练集2.0

[复制链接]

33

主题

289

帖子

8946

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8946
 楼主| 发表于 2025-10-19 15:16:30 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:2  参与人数:1  我的评分:未评
本帖最后由 fghfdg 于 2025-10-20 17:49 编辑

之前发过一份全明星训练集1.0,发现1.0增强过的图片非常差,只能把全部数据删了一份一份下回来重新筛选。这次是没有一张是增强过的2.0,相比于1.0增加了更多的明星数量(共计80人),导出图片的人脸特征点后删除了所有特征点错误的人脸,删除所有用ai修复过的图片。从论坛下载下来的各个明星的高质量src共计200万左右的图片(一般我只挑妆容统一的4k素材切的素材)+我自己切的主流明星的高质量src共计70万左右(妆容统一的4k素材加少量高清生图切出来的2048的人脸)用Duplicate Cleaner去重后剩下147403张(全明星训练集2.0)。
用Duplicate Cleaner以最宽松的规则去重的是2.0的。去重判断为重复的两多百万张图片里挑出来的所有大角度图片共14万张大角度这一份是筛选后(就是被判断为重复的图片)挑选出来的大角度图片,给模型学习各种大角度场景,大角度训练集共计196380张图

数量.png 屏幕截图 2025-10-19 151329.png
  全明星训练集大角度
新大角度188535 .png



全明星训练集
全明星训练集137841.png





分割线————————————————————
这两份素材是我整理来自己搞个预训练模型的。因为是第一次从头预训练,经验不足,效果不好。有没有大佬能预训练一个liae-udt352-512-96-96-34的模型,要求质感好,上下牙清晰。我能提供训练素材,并且把以上总数1t的资源+https://dfldata.cc/forum.php?mod ... =20983&highlight=8k这个8k资源+https://dfldata.cc/forum.php?mod ... 1054&extra=page%3D1里面提到的田曦薇8k素材免费分享
回复

使用道具 举报

15

主题

3611

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19702

真我风采勋章万事如意节日勋章

发表于 2025-10-24 02:53:04 | 显示全部楼层
fghfdg 发表于 2025-10-23 12:14
我都说了是用论坛上的src筛选出来的还有论坛上没切的素材,其他人的预训练素材我也有啊,这个就当是其他一 ...

10几万 筛选完,就留了200张。。。
回复 支持 1 反对 0

使用道具 举报

15

主题

3611

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19702

真我风采勋章万事如意节日勋章

发表于 2025-10-23 10:12:04 | 显示全部楼层
本帖最后由 wtxx8888 于 2025-10-23 10:33 编辑

终于下完了,你素材的 大角度。。。
竟然逐帧。。。这是,只靠自动 去筛选呗?
数量吓死人,实际才80人(你自己的统计),这能预训练?效果能好,都有鬼了。
但凡你看看,公开的数据集 都是什么样的组合,就知道区区80人,连个垫底 都够不上。。。
回复 支持 1 反对 0

使用道具 举报

33

主题

289

帖子

8946

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8946
 楼主| 发表于 2025-10-19 16:13:38 | 显示全部楼层
一介书生 发表于 2025-10-19 16:09
1T啊,告辞,切好的也有这么大么

就是切好的,不过我切的部分都是2048的,我自己切出来的差不多有九十万张图片吧,从其他地方收集的大概一百七百十万张,有512有1024的。所以才会有1t,如果按照512分辨率的话,应该就是五百多g吧
回复 支持 1 反对 0

使用道具 举报

23

主题

136

帖子

2222

积分

初级丹圣

Rank: 8Rank: 8

积分
2222

万事如意节日勋章开心娱乐节日勋章节日欢乐之星勋章

发表于 2025-10-19 15:42:46 | 显示全部楼层
你这个2.0和你的2.1版本有何区别
回复 支持 反对

使用道具 举报

33

主题

289

帖子

8946

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8946
 楼主| 发表于 2025-10-19 16:03:50 | 显示全部楼层
追风者 发表于 2025-10-19 15:42
你这个2.0和你的2.1版本有何区别

一样的,不同论坛而已
回复 支持 反对

使用道具 举报

0

主题

16

帖子

269

积分

初级丹师

Rank: 3Rank: 3

积分
269
发表于 2025-10-19 16:09:21 | 显示全部楼层
1T啊,告辞,切好的也有这么大么
回复 支持 反对

使用道具 举报

15

主题

3611

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19702

真我风采勋章万事如意节日勋章

发表于 2025-10-19 18:36:18 | 显示全部楼层
看看 有能用的图不。
回复 支持 反对

使用道具 举报

13

主题

87

帖子

1414

积分

初级丹圣

Rank: 8Rank: 8

积分
1414

万事如意节日勋章

发表于 2025-10-19 18:58:12 | 显示全部楼层
我以为是文件夹那种的 买了以后结果发现是faceset,求教一下正确的使用方法,我理解的是先全部丢src开始训练,然后再找某个明星的src放进去训练?
回复 支持 反对

使用道具 举报

23

主题

136

帖子

2222

积分

初级丹圣

Rank: 8Rank: 8

积分
2222

万事如意节日勋章开心娱乐节日勋章节日欢乐之星勋章

发表于 2025-10-19 20:04:51 | 显示全部楼层
fghfdg 发表于 2025-10-19 16:13
就是切好的,不过我切的部分都是2048的,我自己切出来的差不多有九十万张图片吧,从其他地方收集的大概一 ...

哪来的1T啊,为啥我下的才35G
回复 支持 反对

使用道具 举报

33

主题

289

帖子

8946

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8946
 楼主| 发表于 2025-10-19 22:12:40 | 显示全部楼层
追风者 发表于 2025-10-19 20:04
哪来的1T啊,为啥我下的才35G

1t的是总数,我都说了一样的,不同论坛而已
回复 支持 反对

使用道具 举报

33

主题

289

帖子

8946

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8946
 楼主| 发表于 2025-10-19 22:16:32 | 显示全部楼层
pantyhose 发表于 2025-10-19 18:58
我以为是文件夹那种的 买了以后结果发现是faceset,求教一下正确的使用方法,我理解的是先全部丢src开始训 ...

图1图2,1T是总数和包含了哪些人物的图片,就是用用Duplicate Cleaner去重前的,我发的是去重后的src全明星训练集。我弄这个是用来搞预训练模型的,当然你喜欢的话拿来正训也行
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-12-8 01:57 , Processed in 0.158358 second(s), 39 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表