deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 7261|回复: 63

香港中文大学CelebA预训练集-WF512版-量大角度全-11万5千张

  [复制链接]

26

主题

333

帖子

2万

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27752
 楼主| 发表于 2023-4-8 13:58:07 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:3  参与人数:1  我的评分:未评
本帖最后由 windjet 于 2023-4-25 19:47 编辑

香港中文大学多媒体实验室发布的CelebA数据集不同于普通的单纯图片包,是真正的数据集合,具有可以归类抽取头像的特点,它具有性别,发色,刘海,眼镜,可爱,年轻,胡须等多达40个人脸特征属性,可以利用CelebA属性选择器(SAFC)来定制自己特有的训练集合,如戴眼镜的女性,年轻又可爱的金发女性等各种特有集合,CelebA属性选择器的下载可以参考最下面的链接。

另外值得特别说明的是,DeepFaceLab的开发者也是使用CelebA数据集来做测试的,你可以看一看20211120原版DFL的\_internal\DeepFaceLab\test.py文件就知道了,里面含有大量CelebA信息,比如8293行,它是默认指定CelebA数据集(pretrain_CelebA)来预训练的,就不用说例子里面的\_internal\DeepFaceLab\samplelib\SampleGeneratorFaceCelebAMaskHQ.py文件了,基本上就是利用了CelebA蒙板高清衍生数据集(CelebAMask-HQ)来操作演示,这大概是因为目前的通用大型数据集里面只有CelebA数据集是属性最多,角度可能也是最全的。

本版本是CelebA数据集里面的WF512版本,原图虽然有20万张以上,但分辨率大小不统一,挑选出能适合切成分辨率512脸的头像只有11万5千张,分辨率提上去了,数量有所降低。
但就512分辨率来说,这也是目前论坛里面切好脸能直接用于DeepFaceLab训练的,数量最多的单个512训练集合了,纯粹追求最大数量的朋友请参考帖子最下面的链接下载20万张的WF256训练集即可,也是支持SAFC的。
这个WF512版同样继承了CelebA数据集的姿势变化多,背景复杂,属性丰富的特点,同样也整理掉了部分不合适头像以及删除了90%的戴墨镜的头像,用MachineVideoEditor看角度分布图也是不错的,下面挑选几位美女当门面女郎给大家欣赏一下。



MVE的1.5倍角度如下所示:


MVE的1.0倍角度如下所示:


训练中效果图:


训练集整体样本图:


文件下载后就是pak文件包(faceset.pak),可以直接使用,不用再解压为图片了,除非你想加自己的资源,DFL对pak包的装载远远快于对单张图片的装载。
使用方法:
1,官方标准预训练模型的训练(pretrain: True),把"\_internal\pretrain_faces"下面的原始faceset.pak备份,然后用这个faceset.pak包替换它。
2,非官方标准预训练模型的训练(pretrain: False),把faceset.pak包放"\data_src\aligned"和"\data_dst\aligned"下各一份,直接用不要再解压成图片了。
3,专人模型的训练,把faceset.pak包放"\data_dst\aligned"下,直接用不要再解压成图片了。
4,想看头像图片,把faceset.pak包放"\data_dst\aligned"下,执行5.2) data_dst util faceset unpack.bat来解压图片。

CelebA属性选择器(SAFC)的下载:
https://dfldata.cc/forum.php?mod=viewthread&tid=13874
CelebA属性选择器V1版-定制自己的特有训练集-免费送4万头像

追求最大数量的朋友请下载这个20万张的WF256训练集:
https://dfldata.cc/forum.php?mod=viewthread&tid=13537
香港中文大学CelebA预训练集-20万头像-论坛数量最多角度最全

需要1024分辨率的请下载附件里面的CelebA蒙板高清衍生数据集(CelebAMask-HQ)这个版本(网盘里面含有男女混合及纯女性两个WF1024版本):

这个版本是以前的“香港中文大学CelebA衍生预训练集-3万头像-官方高清WF512”帖子的改版,不再单独提供下载,已经整合到这个帖子里面。
因为以前旧的头像不支持CelebA属性选择器(SAFC),所以重新切了支持SAFC的新的1024分辨率的头像(高清CelebA-HQ衍生预训练集),并额外增加了纯女性WF1024版本,请下载过的人重新下载,不然无法支持SAFC,旧的WF512的头像将不再保留,如果你还想用WF512,请执行5.2) data_dst util faceset resize.bat来改变尺寸即可,不用重新切脸否则会导致产生垃圾头像的问题,DFL降分辨率是很容易的一件事,已经买过以前帖子的人不用重新购买,链接和密码是一样的。

此外,WF256还有一个目前数量第2多的16万张的CACD预训练集,数量虽然少一点,但基本都是电影明星且带名字排序,更具有收藏价值。
https://dfldata.cc/forum.php?mod=viewthread&tid=13421
CACD预训练集-WF256-共16万带名字影星头像-超多重磅!

更新日志:
---2023年04月16日
1,增加了与之配套的CelebA属性选择器(SAFC)软件,可以利用数据集的40个属性来定制自己特有的训练集合,如戴眼镜的女性等,下载地址见上。
2,增加了分辨率1024的头像,为以前香港中文大学CelebA-HQ衍生预训练集旧帖子的改版,已经整合到这个帖子里面,可以在附件文件里面下载。









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册(仅限QQ邮箱)

x
风擎,就是风之引擎。
回复

使用道具 举报

26

主题

333

帖子

2万

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27752
 楼主| 发表于 2023-4-8 22:49:51 | 显示全部楼层
zindartfb 发表于 2023-4-8 22:18
大佬,放到\_internal\pretrain_faces下开启预训练后报错.哪错了?求教

pak包我放\_internal\pretrain_faces下测试过没有问题的,你先确认:
1,不能改faceset.pak的名字,然后放\_internal\pretrain_faces下面。
2,要开启预训练模式,即在模型训练询问你的最后一步时,要选y才行。
[y] Enable pretraining mode ( y/n ?:help ) :y
3,最好你上几张张报错的图上来,才好帮助你,尤其是最初的报错图和最后的报错图。
风擎,就是风之引擎。
回复 支持 反对

使用道具 举报

26

主题

333

帖子

2万

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27752
 楼主| 发表于 2023-4-16 14:47:57 | 显示全部楼层
本帖最后由 windjet 于 2023-4-23 08:50 编辑

更新日志:通知
---2023年04月16日
1,增加了与之配套的CelebA属性选择器(SAFC)软件,可以利用数据集的40个属性来定制自己特有的训练集合,如戴眼镜的女性等,下载地址如下:
https://dfldata.cc/forum.php?mod=viewthread&tid=13874
2,增加了分辨率1024的头像,为以前香港中文大学CelebA-HQ衍生预训练集旧帖子的改版,已经整合到这个帖子里面,可以在附件文件里面下载。
风擎,就是风之引擎。
回复 支持 反对

使用道具 举报

2

主题

212

帖子

1868

积分

初级丹圣

Rank: 8Rank: 8

积分
1868
发表于 2023-4-8 14:29:47 | 显示全部楼层
感谢分享
回复

使用道具 举报

3

主题

49

帖子

1907

积分

初级丹圣

Rank: 8Rank: 8

积分
1907
发表于 2023-4-8 22:09:39 | 显示全部楼层
感谢分享!!
回复

使用道具 举报

4

主题

52

帖子

382

积分

初级丹师

Rank: 3Rank: 3

积分
382
发表于 2023-4-8 22:18:04 | 显示全部楼层
大佬,放到\_internal\pretrain_faces下开启预训练后报错.哪错了?求教
回复 支持 反对

使用道具 举报

4

主题

22

帖子

270

积分

初级丹师

Rank: 3Rank: 3

积分
270
发表于 2023-4-8 23:50:55 | 显示全部楼层
为什么 我用汉化版的开启预训练提示 未提供训练数据   而原版的一切正常   是汉化的原因吗
回复 支持 反对

使用道具 举报

4

主题

52

帖子

382

积分

初级丹师

Rank: 3Rank: 3

积分
382
发表于 2023-4-9 00:03:40 | 显示全部楼层
windjet 发表于 2023-4-8 22:49
pak包我放\_internal\pretrain_faces下测试过没有问题的,你先确认:
1,不能改faceset.pak的名字,然后 ...

谢谢大佬的回复,我不会贴图,把报错内容贴上,您给看看
加载名为 Roberta Gemma_SAEHD 的模型...

选择一个或多个 GPU 编号(以逗号分隔).

[CPU] : CPU
  [0] : NVIDIA GeForce RTX 3060

[0] 选择哪些 GPU 索引? :
0



两秒内按下Enter键设置模型参数...
[0] 几个小时备份一次 ( 0..24  按英文?获取帮助信息 ) :
0
[n] 保存预览历史记录 ( y/n  按英文?获取帮助信息 ) :
n
[0] 目标迭代次数 :
0
[n] 随机翻转SRC人脸 ( y/n  按英文?获取帮助信息 ) :
n
[y] 随机翻转DST人脸 ( y/n  按英文?获取帮助信息 ) :
y
[8] 批量大小 (  按英文?获取帮助信息 ) :
8
[y] 训练遮罩内的人脸 Masked training ( y/n  按英文?获取帮助信息 ) :
y
[y] 眼睛和嘴巴优先 Eyes and mouth priority ( y/n  按英文?获取帮助信息 ) :
y
[y] 侧脸优化 Uniform yaw distribution of samples ( y/n  按英文?获取帮助信息 ) :
y
[y] 模糊遮罩边缘 Blur out mask ( y/n  按英文?获取帮助信息 ) :
y
[y] 将模型和优化器放在GPU上运行 Place models and optimizer on GPU ( y/n  按英文?获取帮助信息 ) :
y
[y] 使用AdaBelief优化器? Use AdaBelief optimizer? ( y/n  按英文?获取帮助信息 ) :
y
[y] 使用学习率下降 Use learning rate dropout ( n/y/cpu  按英文?获取帮助信息 ) :
y
[n] 随机扭曲 Enable random warp of samples ( y/n  按英文?获取帮助信息 ) :
n
[0.01] 随机色调/饱和度/光强度 ( 0.0 .. 0.3  按英文?获取帮助信息 ) :
0.01
[0.1] GAN强度 GAN power ( 0.0 .. 5.0  按英文?获取帮助信息 ) :
0.1
[32] gan补丁大小 GAN patch size ( 3-640  按英文?获取帮助信息 ) :
32
[16] GAN维度 GAN dimensions ( 4-512  按英文?获取帮助信息 ) :
16
[0.0] 人脸风格强度 Face style power ( 0.0..100.0  按英文?获取帮助信息 ) :
0.0
[0.0] 背景风格强度 Background style power ( 0.0..100.0  按英文?获取帮助信息 ) :
0.0
[none] 颜色转换模式 Color transfer for src faceset ( none/rct/lct/mkl/idt/sot  按英文?获取帮助信息 ) :
none
[n] 启用梯度剪裁 Enable gradient clipping ( y/n  按英文?获取帮助信息 ) :
n
[n] 启用预训练 ( y/n  按英文?获取帮助信息 ) : y
Initializing models: 100%|###############################################################| 5/5 [00:04<00:00,  1.10it/s]
加载样本中...: 0it [00:00, ?it/s]
Error: 未提供训练数据.
Traceback (most recent call last):
  File "C:\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\mainscripts\Trainer.py", line 58, in trainerThread
    debug=debug)
  File "C:\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\models\ModelBase.py", line 199, in __init__
    self.on_initialize()
  File "C:\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\models\Model_SAEHD\Model.py", line 684, in on_initialize
    generators_count=src_generators_count ),
  File "C:\DFL_maozhihanhua_RTX3000\_internal\DeepFaceLab\samplelib\SampleGeneratorFace.py", line 48, in __init__
    raise ValueError('未提供训练数据.')
ValueError: 未提供训练数据.
回复 支持 反对

使用道具 举报

4

主题

52

帖子

382

积分

初级丹师

Rank: 3Rank: 3

积分
382
发表于 2023-4-9 00:13:34 | 显示全部楼层
xiaoqiic 发表于 2023-4-8 23:50
为什么 我用汉化版的开启预训练提示 未提供训练数据   而原版的一切正常   是汉化的原因吗 ...

呃,我也是汉化版开启预训练提示未提供训练数据.
回复 支持 反对

使用道具 举报

4

主题

52

帖子

382

积分

初级丹师

Rank: 3Rank: 3

积分
382
发表于 2023-4-9 00:27:46 | 显示全部楼层
windjet 发表于 2023-4-8 22:49
pak包我放\_internal\pretrain_faces下测试过没有问题的,你先确认:
1,不能改faceset.pak的名字,然后 ...

大佬,我用了另外一个版本没有问题.谢谢您的回复.
回复 支持 反对

使用道具 举报

4

主题

52

帖子

382

积分

初级丹师

Rank: 3Rank: 3

积分
382
发表于 2023-4-9 00:29:29 | 显示全部楼层
xiaoqiic 发表于 2023-4-8 23:50
为什么 我用汉化版的开启预训练提示 未提供训练数据   而原版的一切正常   是汉化的原因吗 ...

用了没汉化的版本确实可以,谢谢兄弟提醒。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-21 21:49 , Processed in 0.141385 second(s), 38 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表