deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1974|回复: 28

出了点问题,此帖当作经验帖吧。终止更新

[复制链接]

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-10 15:59:10 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 takisu88975 于 2024-8-15 19:58 编辑

卧槽,我现在的心情是何等的卧槽,你可能无法理解
参考此帖重磅!!DeepFaceLab软件开发作者对于各项参数的官方介绍!...
https://dfldata.cc/forum.php?mod=viewthread&tid=1606
(出处: deepfacelab中文网)时,我把它当作dfl作者的话了。这不是作者的话,就是那时候的官网教程翻译加上帖主的自己解读,我是随着这几天深入的学习,感觉越来越不对劲
DFL的作者竟然连autoencoder的基本构造都不知道?
怎么可能!我赶紧去那个帖子重新读了一遍。。。。唉,我之前一直说不要吧我的话奉为圭臬,结果我只是以为那是作者的看法,就将其奉为圭臬了。所有因此产生的谬误全部删除。

截至24.8.13    2:50 本贴完成修改
去除被影响到思路的观点
可食用
现在就是一个免费的经验分享帖(永久停更)
未来会把一些核实过的观点见解发表至交流区
炼丹方法(官方):模型训练工作流程(SAEHD-DF) (非万能丹)
第一阶段:预训练(可选)                                                                                                                                                                                            
步骤 1-预训练模型或导入预训练模型。               
输入所有模型设置。
启用预训练模式。
Phase 1: Pretraining (Optional)
Step 1 – Pretrain the model or import a pretrained model.
Enter all the model settings.
Enable Pretrain mode.


第二阶段:泛化/扭曲训练
第 2 步 - 随机扭曲
启用样本随机扭曲
启用蒙面训练(仅限 WF/Head)
禁用 True Face Power(仅限 DF 型号)
禁用 GAN
禁用预训练模式。
(可选)随机翻转SRC、随机翻转DST、颜色传输模式、随机HSL
(可选)在变形阶段添加或删除人脸集图像并更改蒙版
(可选)根据需要启用渐变剪辑
Phase 2: Generalization / Warped Training
Step 2 – Random Warp
Enable Random Warp of samples
Enable Masked training (WF/Head only)
Disable True Face Power (DF models only)
Disable GAN
Disable Pretrain mode.
(Optional) Flip SRC randomly, Flip DST randomly, Color Transfer Mode, Random HSL
(Optional) Add or remove faceset images and alter masks during warp phase
(Optional) Enable gradient clipping as needed


步骤 3 – 眼睛和嘴巴优先(可选)
启用眼睛和嘴巴优先
Step 3 – Eyes and Mouth Priority (Optional)
Enable Eyes and mouth priority


步骤 4 – 均匀偏航(可选)
禁用眼睛和嘴巴优先级
启用样本的均匀偏航分布
Step 4 – Uniform Yaw (Optional)
Disable Eyes and mouth priority
Enable Uniform yaw distribution of samples


步骤 5 - 学习率 Dropout(可选)
启用使用学习率 dropout
(可选)禁用样本的均匀偏航分布
Step 5 – Learning Rate Dropout (Optional)
Enable Use learning rate dropout
(Optional) Disable Uniform yaw distribution of samples


第三阶段:规范化/常规训练
第 6 步 - 定期训练
禁用随机变形
禁用均匀偏航
禁用眼睛和嘴巴优先级
禁用使用学习率
dropoutPhase 3: Normalization / Regular Training
Step 6 – Regular Training
Disable Random Warp
Disable Uniform Yaw
Disable Eyes and mouth priority
Disable Use learning rate dropout


步骤 7 – 样式和颜色(可选)
启用模糊遮罩、‘真实脸部’功率(仅限 DF)、脸部风格功率、背景风格功率
Step 7 – Style and Color (Optional)
Enable Blur out mask, ‘True Face’ power (DF only), Face style power, Background Style Power


步骤 8 – 眼睛和嘴巴优先(可选)
启用眼睛和嘴巴优先
Step 8 – Eyes and Mouth Priority (Optional)
Enable Eyes and mouth priority


步骤 9:均匀偏航(可选)
禁用眼睛和嘴巴优先级
启用样本的均匀偏航分布
Step 9: Uniform Yaw (Optional)
Disable Eyes and mouth priority
Enable Uniform yaw distribution of samples


步骤 10 – LRD(可选)
启用使用学习率 dropout
禁用眼睛和嘴巴优先级
(可选)禁用样本的均匀偏航分布
Step 10 – LRD (Optional)
Enable Use learning rate dropout
Disable Eyes and mouth priority
(Optional) Disable Uniform yaw distribution of samples


阶段 4:增强/GAN 训练(可选)
步骤11-GAN
禁用眼睛和嘴巴优先级
禁用样本的均匀偏航分布
设置 GAN 功率
设置 GAN 补丁大小
设置 GAN 尺寸
Phase 4: Enhancement / GAN Training (Optional)
Step 11 – GAN
Disable Eyes and mouth priority
Disable Uniform yaw distribution of samples
Set GAN power
Set GAN patch size
Set GAN dimensions

专丹参考上方官方教程即可.



训练万能丹(并不是每一步的参数,而是常驻参数)参考自滚石,以及一个B站视频。
我会常驻true face0.005 ;Uniform yaw distribution of samples(样本的均匀偏航分布——侧脸优化)开启;和色彩转换:rct。
什么是万能丹(炼制完成的万能模型)?(论坛有帖告诉了我们答案)及把万能丹放在workspace文件夹中,加上准备好的dst人脸文件,dst切帧图片,dst目标视频,直接合成人脸,再生成result视频。
在这里我不讨论这个,我想再去定义为什么练DF丹,liae为了直播之类的,有好的合成效果,DF是更像,以我的观点,练DF万能丹也好(为了让一个人下各种各样的象棋,各种各样的自我对弈),练DF专人丹也好(让一个人高质量的下某个象棋,认真的与自己对一次高质量奕)。或许我们的目的是丑陋的罢。但至少我是这样想的。所以我的万能丹是狭义上的万能。我的万能丹会采用对弈或者自我对弈dst作为训练素材。并非滚石那样各种各样类型的人脸都有的dst素材。正所谓No technique is forbidden
dst素材选自训练集计划。3合1了
https://dfldata.cc/forum.php?mod=viewthread&tid=10622
(出处: deepfacelab中文网)
我会增添修改dst素材,比如我的目标视频大多是solo,所以我会从我剪辑的dst视频切出的脸加入进去。但是还是基于上方的正训练dst文件。


以下是我训练李珠恩万能丹的步骤和对应的预览图(使用本贴预训练丹,删除了inter.npy文件)务必不要开启梯度裁剪clipgrad(会影响到复用!!!)

屏幕截图 2024-08-10 171910.png 屏幕截图 2024-08-10 172022.png 屏幕截图 2024-08-10 171759.png



第一步:放入你准备好的src,和训练万能模型dst,起始用bs4开始跑3w-5w,然后按自己设备条件可以再增加bs值,不宜直接到最大值比如你最高可跑到16,那选择6—12即可。结束条件,按按空格看看脸型是否八九不离十了。然后仔细看人脸特征,比如我的src,我是看八字纹,双下巴,翘鼻头是否八九不离十了。如果是,并且你的src loss很慢举个例子:每一万次下降小于0.005,你可以停下来,进行第二步了。
============================================================================================================================

屏幕截图 2024-08-11 111411.png 屏幕截图 2024-08-11 111744.png
第二步:参数如上,关闭了rw,开启了嘴眼。你的bs要尽可能大,你可以使用试错法:一点一点增加bs值,直至崩溃,然后找到那个极限值。
嘴眼的训练需要很长时间,如我上面的预览图,我在src=0.4的时候停下来了(还有很大的下降空间,loss下降速率并不慢),你可以看到眼和牙还有瑕疵,你训练时可以不必在这个效果的时候就停下来,但是停下来,不会影响到最终的,专属于你自己的定义的‘万能模型’,我会在下面进行解释。

屏幕截图 2024-08-11 140242.png 屏幕截图 2024-08-11 140259.png 屏幕截图 2024-08-11 140525.png 屏幕截图 2024-08-11 140551.png 屏幕截图 2024-08-11 140615.png 屏幕截图 2024-08-11 140834.png
第三步,细节训练,参数如上gan值介意在0.01~0.1,如果你保守的话,低于0.01也是没问题的。bs建议在16。到你感觉差不多的时候结束。

这个时候这个专属于你的癖好的万能丹的初级训练已经完成了。上面有我合成的dst 人脸合成图(训练时的基石dst人脸中不包含该人脸)。至于额头上的黑痕,因为是现用现绘制的遮罩(mve手绘),没怎么训练,所以部分刘海没去干净。事实上,如果选择与基石dst人脸相差过大的dst视频去合成,效果并不理想,这也是这种特殊向模型初步版本的局限性,至于如何去完善,就在下文。截至此步为止,训练好的模型已经更新到本帖链接(附赠)(取消)
关于gan,我认为它就像一层滤镜一样,必要的时候你可以删除gan文件重来,所以如果你想冒进放手去做吧!
【探讨】关于GAN合适开启,是否可逆,复开?
https://dfldata.cc/forum.php?mod=viewthread&tid=16909
(出处: deepfacelab中文网)

核心要素就是你肯定是对这个src有什么想法之类的。所以src是不变的。dst基石素材(指的是你在上面那三步使用的素材)这个素材是具有目的性的,你懂的。这个初步完成的‘万能丹’你肯定要使用啊,所以你会找些dst视频合成。
image.png image.png


比如我就会把这些切好的整套dst素材(视频、切帧、切脸)放在一个等待这个src万能丹合成的地方(waitingxxx)下级目录就是专人素材。
进入正题,如何完善万能丹。以我这个帖子为例我使用的dst素材里面有3个人A、B、C(三上、桃乃还有一个不认识)仅仅这三个人的脸型当然不能定义万能。你需要把你合成完dst视频后,觉得没达到你满意的效果的整套素材保留下来,举个例子我拿我这个万能模型换D的视频我发现不太满意那我便把D的整套dst素材(视频、切帧、切脸)保留下来。以此类推你可能会保留DFGIU,这五个你觉得不满意的。这会是一个积累你癖好dst的过程。你可以挑出每个人的一组数据
image.png
如图十七张人脸,你可以使用刀哥增改工具【易用工具】src补角度工具1.4更新,可清理角度头像
https://dfldata.cc/forum.php?mod=viewthread&tid=7149
(出处: deepfacelab中文网)
你可以基于表情光影选择17的倍数,但不宜过多,这种相当于自己给自己私人定制。质量更加重要。比如我这五个人我每个人选三组(排列组合下是不止3组的)数据【17(原始组)+17(相同角度、相同光影、不同表情)+17(相同角度、不同光影、不同表情)】*5=255张图(从这5个人中精选出的图片)加入到基石dst中。在这个过程中你可能收集了更多的src(同人物)素材你可以把他们放入原始src中,去其糟粕。(精炼src素材)并且重新从练万能丹第一步再来一遍(复用你的初步万能丹(同src))(你不需要删除任何文件,按照每一步的参数来即可),并且二次(三次)训练,速度会快很多,因为有你初步完成的基础。模型只需要学新的东西即可。





关于src,不论是补角度,还是素材收集种种,简单地探讨一下。相信很多人和我一样,补角度一度以执念的方式纠缠着我们,给我们带来的折磨就像是拿针线穿过皮肤,在抽拉时,痛苦一点一点,一圈一圈,包裹住你的心脏,到达一个阈值时,再猛地攥紧,hold it so tigh,and not let  go。把我们压抑着,逼我们去学各种各样可能可行的补角度方法。他是我已知的作出尝试最多的人,我认为作者给出了我想要的答案。
帖子:尝试了各种补交度的方案 发现都不行 ai 3d建模 之类的https://dfldata.cc/forum.php?mod=viewthread&tid=19068
(出处: deepfacelab中文网)

而我自己尝试了滚石搭建的工作流补角度方法。还有论坛有探讨过的,借由ai绘画作为帮助,训练目标人物的Lora模型,局部重绘什么的等等。总结我自己的经验,还有看到的很多如上的帖子的作者的话。我只能很遗憾地说不尽人意。我们假设你不去选择liae,选择了df就相当于在好的融合度和人脸轮廓(最为主要的,当然人脸相似上df和liae也存在区别)的相似上你选择了后者?那么相信我,如果你把这些AI学习后的补给你的素材加进去,你失去的更多,不过我认为有一类特殊情况例外,假设你拥有一套精品src,但是,缺了一些角度(数量远远小于你原素材数量,这样造成的影响更小)你没法获得新的素材了,src退网了还是怎么样之类的。你可以使用滚石搭建的工作流,补出你缺少的角度(主要是为了更快获得那个角度下的人脸轮廓),然后用你的原素材,在ps或者什么图片编辑软件之类,就像做手术一样给补充素材植皮,移植眼睛、眉毛(五官)-——为了减小对原素材的影响,这个说难吧,网上(如b站)一大堆ps教学视频都有,只需学会ps的一些基本工具就可以做到。但是我认为这就是一个无底洞,过程简单(突然想起来还有相当一部分人不会使用滚石最新搭建的补角度工作流)但是,工作量很大,指移植过程。你把这些搞好了,废了这么大的劲,是不是会想到这个? image.png 我在本贴写的怎么扩充自己的专属dst素材部分,有提到的排列组合。
然后你长叹一口气,What I WIll Done ,Can Not Be Undone 开始学习补充光影,学习移植眼神(斗鸡眼斜眼,眼睛睁开闭合程度)移植表情,比如笑容,鄙视,你还需要考虑到你原素材做出表情时,肌肉群变化。兄弟?!?你要复活谁啊!!收手吧。

注意注意!!!!!上面这种情况还是最理想的情况下,工作量最小的一类。这工作量是随着缺少角度数量的增加 ,呈指数级上升的。
还有人脸高清化(AI细节增强),我不建议使用,因为我接触DFL这几年里,我的精力大都都投入到,不是在补角度,就是在学习补角度的路上,我大部分素材都是经过工作流高清化的,最后练出的丹,真的一言难尽。(虽然我在这里想列举出来,不行的地方,但如鲠在喉)
如要了解详情,论坛里有很多经验帖列出使用高清化,对训练结果造成的影响——我说这些是基于寻求'像',如果你对此不在乎,可以包容违和感,那么这就对你来说不是问题,而且能节省你很多精力。
稍微糊一点的素材,你要么用ps给它移植(前提是你有同src其他的高清素材,要不然没有意义)(千万别碰什么美颜——你既然选择了像——ps还好——某音的美颜,给条狗用都看着眉清目秀),要么将就用,underautoencoder(欠完备自动编码器)工作原理可以片面的说是一个降维的过程(encoder重新表述,decoder依照表述进行重建,encoder重新表述时会依照输入层传入的数据进行筛选)(如有谬误,请指正)src中有次有好,它会过滤掉一些次质量素材的瑕疵,但如果此质量素材过多会影响到最终人脸,凑合用吧。
如果你非要用你那套素材,我提供一个非常好的解决方案,剪切你的目标视频,比如用pr,吧目标视频大角度(也可以包括半脸出镜,大面积遮挡,运动模糊严重——你懂的关于这个,我多说一点,你不要剪切的时候绝对这个可以保留,那个可以保留,当断不断反遭其乱,比如目标视频dst人物处于癫狂的时候,脸部运动幅度过大,头发甩来甩去,运动模糊严重,你还觉得这是精华部分,等你切脸查错,手取的时候就知道什么叫做痛苦了)的部分用剃刀工具切出来,然后右击该段,波纹删除,如果你要求高,可以多切一些来衔接视频的流畅观感。
我认为这种方法可谓是事半功倍(对比补角度来言)。事实上我这些年来一直在使用这种方法。
如果你和我曾经一样一直在自己搞一些不完善的素材,并在自行完善,我建议你去论坛找一些高质量素材,训练出一个模型,然后好好思量,为了完善自己搞得那套素材,你需要付出什么样的代价。
你可以保留你的素材,等待科技的发展,或者是你马尼够多,你可以去思考我上方引用的举例帖里面的方法,雕塑之类的可行性。

这里开始探讨src素材的收集,以某音视频号 x子日记为例 类似 某x六点半  里面有个人x婷,我曾经尝试截取过他的素材,一共三次,对比该视频号发布的平台,油管,b站,某音
首先b站视频码率是最低的,我只以此为例,如果你碰到多平台发布的情况,下载然后对比,然鹅这仅仅是个开始,众所周知油管网飞财大气粗,码率往上使劲怼,毫无疑问,他在油管发布的视频分辨率最高,码率最大,但是,我在第二次收集的时候突然发现一个问题,有些视频内置推广,在别的平台发布时会剪掉,我意识到有没有一种可能?(对于该视频号流量,某音>b>油管,视频也是先在某音发布)某音的才是原版(720p码率1.5~3m不等)我甚至在想有没有一种可能该视频的拍摄是由手机全程完成的?以至于虽然油管部分视频看似1080p码率3.4mps,但经过实际对比是经由720p直接导出1080p,全是假的,清晰度还不是不变,还更糊了。对于这种清晰度,码率的视频,收集时建议只保留画面中人脸占据四分之一分辨率以上的近脸。(这样切出来都没什么纹理细节)远脸切出来没法看。
对于这种又拍短剧又直播的,你注意一下脸型,有些本来就挺好看,开了直播开美颜上滤镜,脸型五官都有变化了(前者较大,后者较小)切正常素材切不动的时候,你可以去用录播视频去补充来偷懒,但你应该用(Renamer)这个软件来给你添加的录播src素材打上前缀比如A、B、C,等你有空用正经素材完善的时候,按文件名排序可以快速删除录播补充素材。










上调至500灵石以防有人再买






作者的话:我自21年末接触到这个方面,起因是在油管看见了猫之汉化的教学视频,发现这个论坛后,我读完了大部分教学帖子(有些高级贴穷哥们我读不了)。一知半解,四处碰壁,这是我当时的状态,摸索了一段时间后我便废弃了这个方面。我相信很多很多人都和我一样,从0到1make us suffer。哪怕到了一之后我们应该也是在一个发现盲区,感到困惑,四处求知,多半碰壁的区间内。(各位对炼丹了解很深的大佬,有一些会在一些冷门的求知贴劝萌新或者询问者多去看帖,而没有给出一个答案(哪怕这个答案并不那么准确)。固然大佬们没有义务这么做,事实上论坛里确实有对应的帖子,或者是海外论坛里也有对应的解答.不给出答案,也遏制了伸手党和巨婴在论坛里的发展。)关于读帖,随风大佬的贴很好,我从中深受启发,但有些贴已经残缺了(和版权有关),我希望那部分帖子可以不要影响到你的思路。言归正传,关于训练DF(本贴不会过多探讨liae方面的知识)模型的学习,付出的时间和精力成本很大,从心理学上,每一次挫折都会削减我们在这方面的积极性。日积月累下,有些人的放弃是必然的。我想在这篇我的模型分享处女帖,给出一个尽可能完整的流程(万能丹)。让一些萌新或者此贴目标人群,把一切变得简单,先做再去探索未知的东西,比如某些大佬在做各个参数对预训练模型的影响。 What I WIll Done ,Can Not Be Undone。
如果你使用本贴预训练丹可以删除inter.npy文件,也可以保留,没有开梯度裁剪影响不大。(实测删除src_dst.opt文件有概率造成整个模型不可逆的损毁——当你删除opt开始训练时,会重建一个opt,在其他参都不变,素材也不改变的情况下依然有可能会发生,此时强制退出,还原opt有可能阻止,事实上有可能这样也没有用,至于原理我还在探寻。这种情况下你最好庆幸自己做好了全部文件的备份,否则你的付出有可能化为泡沫。)


预训练模型预览图:
屏幕截图 2024-08-09 203407.png 屏幕截图 2024-08-09 203449.png 屏幕截图 2024-08-09 203530.png 屏幕截图 2024-08-09 203554.png

预训练BS值下方油管视频作者推荐是慢慢给高直至OOM报错,然后下调一些,开始跑。
视频
https://www.youtube.com/watch?v=zpOclEB2-dk
海外论坛参数帖
https://www.deepfakevfx.com/guides/model-training-settings/
炼制方法参考自滚石帖
【新手入门】预训练模型的概念与用法
https://dfldata.cc/forum.php?mod=viewthread&tid=160
(出处: deepfacelab中文网)


关于autoencoder的学习
油管链接https://www.youtube.com/watch?v= ... 19K3ptD8FAq&index=1


炼丹第四次进展报告,一个好的素材才是成功的关键之一
https://dfldata.cc/forum.php?mod=viewthread&tid=19171
(出处: deepfacelab中文网)
由这个帖子的提问而起。
我先回答此帖的问题
1.不过恰恰拉下了一个最重要的问题,那就是素材人脸五官特征,不清楚这个是否会写入,
answer1.
举一个简单的例子在autoencoder中inter layer向encoder传输原始数据画张图吧。
QQ图片20240812153622.jpg
其中类似打点的地方就是encoder根据素材分析编码成的latent variable隐藏变量我习惯把它叫做表述然后decoder根据表述重建输入,这就是一个解码的过程,事实上你可以将隐藏变量视作代码,最后decoder将重建后的结果输出到输出层,也就是你所看到的绘制的东西。
打个比方encoder是人物甲,我是decoder,我和你们在一起,甲看到一个重磅消息,他和我的关系最好,把我拉到一个小黑屋里告诉我那个事情,这就相当于我画的图两个竖线中间的部分,这个过程(在小黑屋里)你们是看不见的,我们把它叫做隐藏层,甲这个人描述事情喜欢精简,你可以理解为缩句,我这个人说话喜欢添油加醋但是不会偏离要义,你可以理解为扩句,甲简明的把这个事件告诉我,我理解后,走出小黑屋,给你们分享这个瓜,我会像扩句一样添加形容词,来让我的描绘更加饱满。那甲知道的事情和我所表述的事情是一个东西吗?是但又不像原版那么完美。


2.眼嘴优先,侧脸优先的时候,是否根据写入的特征进行找点训练。
answer2.
侧脸优化我更加愿意叫做样本的均匀偏航分布,你可以直接就从这个名字知道它是上面原理。
首先判断人脸角度可以想象成 image.png 由landmark脸左右、上下的向量相减(你可以这么理解)来区分水平方向偏航多少度,竖直方向偏航多少度。至于是左边还是右边,你可以参考我的图
随着角度增大从2维层面看你能发现人五官在发生改变,landmark也在变,至于是怎么变的,如果你有查看过aligned debug文件夹下的图片,我相信你应该明白,不再赘述,整个dfl文件夹里面应该有基于landmark标记的检测工具来判断偏航,启用均匀偏航分布(侧脸优化)你现在是不是看见这个名词就明白他的用途了?
至于询问帖主所说的找点,你这么理解,启用均匀偏航才是完全体,事实上以前那个被移除的完全体SEAHD模型就是把均匀偏航封装进去了。后面独立成一个可选参数。这个时候相当于你所有样本均匀学习,而关闭它就相当于更多的画正脸(小角度样本)。




所以如果你自己裁剪一个512*512分辨率的人脸文件直接训练,DFL会提醒你这不是所需要的人脸文件,他没有DFL训练时需要的写入图片的landmark等训练用信息。

我会在这以下更新关于系统一点完整一点的autoencoder初级学习。

不用学了学会了才发现这只是一部分,如果想更加深入,你可以去了解生成、判别器对抗算法



为什么选ud,
选了d你本来能跑224的,现在能跑更高分辨率的,同参数对比其他本来就能跑的(不开d)炼丹总时长增加,但是效果不会衰减。
选了u模型性质改变了。不带u是SEA模型,在很久很久以前有一个模型叫SEAHD DF(在一次版本更新中被移除了,但是它以另外一个方式存在着。),这个已经被移除的模型有一个轻量版叫做SEAGHD DF—UHD(在SEAHD DF被移除时更名为SEAHD DF-U)。原始版SEAHD就相当于现在DFL版本把你正式炼丹(丹为SEAHD DF-U)时的两个训练参数整合进去了,一个是侧脸优化,还有一个我记不得了,这不重要。也就是说现在的SEAHD DF模型,其实是SEA DF模型,当你开了U(SEAHD DF—U(现在版本的)=SEAHD DF-UHD(过去版本的)),在加上你正式训练完成(SEAHD DF-U(现在版本的,完成了炼制)),这个训练的过程你会用到那两个被从原始SEAHD DF模型中独立下来的参数。这个训练完成的丹就可以说是那个被移除的真正意义上的模型(SEAHD DF(过去版本的))——一个正常训练完成的SEAHD DF-U模型就是那个被移除的SEAHD DF 模型。
可能有点绕,这段是给目标人群看的,有相当一部分人在纠结这个。见谅。











image.png
image.png
image.png
image.png
image.png
image.png

评分

参与人数 8贡献 +8 收起 理由
Terea + 1 非常牛!
redgg2 + 1 十分给力!
iou99vip + 1 十分给力!
冷死的e + 1 十分给力!
pasanonic + 1
bobowxc + 1
iCode + 1 十分给力!
bug008 + 1 十分给力!

查看全部评分

回复

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-25 20:41:36 | 显示全部楼层
takisu88975 发表于 2024-8-25 20:37
那等待吧,我十天前开始训练了一个320dfudt的lje的万能模型用本论坛的素材加我去油管补的角度,3800张src ...

会等待挺久至少到九月下旬,如果你感兴趣的话攒好灵石吧
,那个遮罩很难化,万能模型都处理不好她的脸,又是贴纸又是刘海。还得保留泪痣,我本来分组画遮罩训练,后面发现很难去除贴纸同时保留泪痣,索性一张张画了
回复 支持 0 反对 1

使用道具 举报

21

主题

277

帖子

3403

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3403
发表于 2024-8-12 04:39:14 | 显示全部楼层
看你的教程我又开了新模,我的d-dims开96延迟是339,把d-dims开到128直接延迟翻倍了跑到500多ms,这个参数挺迷的,不过d-d开大了确实不一样,最后一列成像比第二、五列快的多,考虑到后期bs要开到8以上,还是取96凑合玩吧,细节不细节什么的无所谓了,这次铁了心要硬刚迭代,不走捷径,炼出真正的高清丹出来
回复 支持 1 反对 0

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-10 18:09:28 | 显示全部楼层
欢迎在这里询问疑惑的地方,我会在评论区尽可能的回答,并且更新我的帖子
回复 支持 反对

使用道具 举报

14

主题

2945

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15953

真我风采勋章万事如意节日勋章

发表于 2024-8-11 03:09:06 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-8-11 03:11 编辑

购买支持一下,用心学的人。丹就不用了。。。
这个AE,E,D的三围,太奇葩了
回复 支持 反对

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-11 10:51:01 | 显示全部楼层
wtxx8888 发表于 2024-8-11 03:09
购买支持一下,用心学的人。丹就不用了。。。
这个AE,E,D的三围,太奇葩了 ...

谢谢支持。
回复 支持 反对

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-11 12:34:21 | 显示全部楼层
我看有人检测链接失效我试了一下没有问题,可能刚好我更新完了一次帖子,上传更新的时候的检查bug吧,如果你还是显示失效,回复我此条评论
回复 支持 反对

使用道具 举报

40

主题

862

帖子

4712

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4712

万事如意节日勋章

发表于 2024-8-11 21:08:40 | 显示全部楼层
本帖最后由 pasanonic 于 2024-8-11 21:52 编辑

内容丰富,很久没看到这种大篇幅的文章了, 赞一个
回复 支持 反对

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-11 23:41:42 | 显示全部楼层
pasanonic 发表于 2024-8-11 21:08
内容丰富,很久没看到这种大篇幅的文章了, 赞一个

感谢你的支持
回复 支持 反对

使用道具 举报

2

主题

69

帖子

391

积分

初级丹师

Rank: 3Rank: 3

积分
391
 楼主| 发表于 2024-8-12 04:58:22 | 显示全部楼层
dfl9999 发表于 2024-8-12 04:39
看你的教程我又开了新模,我的d-dims开96延迟是339,把d-dims开到128直接延迟翻倍了跑到500多ms,这个参数 ...

此帖就是为了互相探讨,查误祝你练出属于自己的专丹
回复 支持 反对

使用道具 举报

5

主题

118

帖子

762

积分

高级丹师

Rank: 5Rank: 5

积分
762

万事如意节日勋章

发表于 2024-8-12 15:18:38 | 显示全部楼层
曾热衷学习一段时间,后来跟学comfyui一段时间,现在发现dfl模型和dfm才是能真正表现人的作品。购买纯支持,随风大佬的文章逐篇拜读学习过,虽然专业学识距离有点大。我还会一直学习dfl。楼主加油,我在后面。。。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-23 18:00 , Processed in 0.162948 second(s), 47 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表