deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1522|回复: 10

参数的优先级?模型大小,bs,gan 哪个最重要?

[复制链接]

42

主题

274

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
 楼主| 发表于 2023-7-24 09:12:59 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
如题,想做出一个高质量高画质的换脸视频,同样一张显卡,实战时应该优先选择大分辨率模型 还是选择小分辨率模型开大bs和gan?假如我用384模型可以开bs 10,但是256模型可以开到16以上甚至20的话,在同等条件下(及两个模型的训练手法相同)哪个出来的效果会更好?
回复

使用道具 举报

11

主题

684

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
发表于 2023-7-26 17:50:43 | 显示全部楼层
slib 发表于 2023-7-26 00:43
那实战的话 如果底丹本身参数是开gan的,我素材比较清晰的情况,是不是直接按原本底丹的高bs参数和gan直 ...

https://dfldata.cc/forum.php?mod=viewthread&tid=3708按照这个练吧,如果gan,参数改为0·001,想要效果好,肯定得花时间。如果只是换着玩,几个小时的也能凑合看
回复 支持 1 反对 0

使用道具 举报

15

主题

1921

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
27057

万事如意节日勋章

发表于 2023-7-25 01:51:47 | 显示全部楼层
本帖最后由 come3002 于 2023-7-25 02:01 编辑

一般而言,384>320>256.

4K近景切WF1536 (大多数 4k的樱花国 切到这个程度即可)
左1 论坛下载 448 dfud512  88 88 28                   (不清楚)              累计不清楚
左2 6.11 87w 320 dfud 352 96 72 24 转 古力专丹(对炼大约30-40w) 累计 122w
左3 自闭        256 dfud 320 88 66 22 林允儿       (不清楚)               累计 不清楚
结果 左1  的细节更清楚,嘴唇纹理最好。但看不到下牙齿
左3 嘴唇纹理不错,能看到上牙齿,但看不到下牙齿
左2 嘴唇纹理不错,能看到比较好的上牙齿,也能看到下牙齿
高质量 448 自闭2.0.png
结论:越是近景,像如图的 4k 近景WF1536 越大模型比如448这个越占优势。
但是如果是中远景能大多数场景,448 在 中远景阶段优势就不是很大。
一点想法:
4k 60fps 樱花国(更多的主流还是1080p)是 3840x2160,樱花国你大多数看到很多都要有上半身吧。我估计了下,看上半身时候人脸切WF1024就够用了)。少量跟我刚截图的近景WF1536。

因此,合适的model 配合合适的SRC(尤其男友角度时候 下牙齿作用极大),炼练就要检测,10w、20w、。。。。
什么是男友角度 下牙齿作用极大(一些樱花不能上传论坛)。下图为例,懂得都懂
完全闭眼,准备入戏

Y10374_0.jpg
眉头开始紧缩 闭眼,一定要多找几张 带下牙齿的
Z01032_0.jpg
眉头继续紧缩痛苦闭眼嘴巴微张。眉头紧缩的多找
Z01043_0.jpg
痛苦闭眼 嘴巴继续张开
360截图20230723184751281.jpg
闭幕
11.jpg
以此类推,某一阶段能在 樱花4k 60fps的多数 中远景 场景 (访谈、浴室、灰暗、
闭眼大嘴巴露下牙齿仰角,)骗过你的眼睛即可(目前大多数樱花还是 1080p))。
相反,一味求大模型(比中等的模型更难炼),一味训练。忽视及时检测 。等炼的差不多时候你会发现尤其SRC男友角度时候 下牙齿一直不好。总是哪里不对劲,再去找补就麻烦了。
此时,越成型的大模型,越难覆写信息。



回复 支持 1 反对 0

使用道具 举报

34

主题

1083

帖子

7278

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7278
发表于 2023-7-24 10:44:40 | 显示全部楼层
384模型相对256应该只是增加分辨率和清晰度的,256出的肯定快点
回复 支持 反对

使用道具 举报

42

主题

274

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
 楼主| 发表于 2023-7-24 12:27:05 | 显示全部楼层
haiou_f 发表于 2023-7-24 10:44
384模型相对256应该只是增加分辨率和清晰度的,256出的肯定快点

是的 我就是想拉高清晰度,快慢是次要,因为我记得bs拉高也能提升清晰度
回复 支持 反对

使用道具 举报

13

主题

1049

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12735
发表于 2023-7-24 17:22:24 | 显示全部楼层
slib 发表于 2023-7-24 12:27
是的 我就是想拉高清晰度,快慢是次要,因为我记得bs拉高也能提升清晰度 ...

bs只是让训练过程更平滑。因为一次计算的图片多,所以梯度取值更平均,和清晰度没啥关系。
其实还是要看你自己的取舍。384训练一次慢多了,参数变多需要的迭代次数也更多,两个因素相乘,出效果也更慢。
回复 支持 反对

使用道具 举报

11

主题

684

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
发表于 2023-7-25 00:52:39 | 显示全部楼层
384更重要,可以换的面部占比大的视频。bs开4-8,慢慢练细节就行。gan得看你素材质量
回复 支持 反对

使用道具 举报

42

主题

274

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
 楼主| 发表于 2023-7-25 09:25:34 | 显示全部楼层
AKERSHUS 发表于 2023-7-25 00:52
384更重要,可以换的面部占比大的视频。bs开4-8,慢慢练细节就行。gan得看你素材质量 ...

为啥gan要看素材质量呀大佬,gan到底是个啥原理
回复 支持 反对

使用道具 举报

11

主题

684

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
发表于 2023-7-25 21:31:53 | 显示全部楼层
slib 发表于 2023-7-25 09:25
为啥gan要看素材质量呀大佬,gan到底是个啥原理

就是把一张图片分成许多小块学习细节。模糊的素材学了也没用,而且gan都是训练到大后期才开的,你要是随便换着玩没必要开
回复 支持 反对

使用道具 举报

42

主题

274

帖子

4101

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4101
 楼主| 发表于 2023-7-26 00:43:31 | 显示全部楼层
AKERSHUS 发表于 2023-7-25 21:31
就是把一张图片分成许多小块学习细节。模糊的素材学了也没用,而且gan都是训练到大后期才开的,你要是随 ...

那实战的话 如果底丹本身参数是开gan的,我素材比较清晰的情况,是不是直接按原本底丹的高bs参数和gan直接练一会儿就好了
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-24 09:20 , Processed in 0.155974 second(s), 38 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表