deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: DFLive

aligned分辨率多少合适

[复制链接]

15

主题

1936

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
26150

万事如意节日勋章

发表于 2023-9-6 08:24:04 | 显示全部楼层
本帖最后由 come3002 于 2023-9-6 15:37 编辑
DFLive 发表于 2023-9-5 22:52
多谢,只是不知按照模型分辨率压缩回去之后,这些纹理的损失有多大。 ...

不清楚。
1024下 既然能看到嘴唇纹理。就可以在实际操作中选出一批优质素材假如 100分。
用 纯100分的做主体 炼 细节自然要快一些。另外出好细节
001051908_0.jpg



1024 下都看不对清晰上牙齿齿缝 假如是20分,数量占一半。
被掺加到炼丹资源中。使得分数为100-20分
那么炼丹时候,dfl就要既跟100分学,也跟20分学。假如20分的低质量比例高,一来拖慢 牙齿等炼丹速度。
二来 20分的素材较多时候,会明显拉低或影响作品质量

360截图20230905151137013.jpg


360截图20230905151156660.jpg

360截图20230905151210538.jpg

360截图20230905151449083.jpg

看到大佬一句话,深有体会
非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024“
分析:
至于 为什么会WF1024 出现如此模糊图片。一方面是动作快。一个是码率低
另一个方面是 某种原因,大多数坛友 采用的办法是直接对4k剧/切割。
一部剧总有 高码率,低码率;镜头也有不同(少量近景可切WF1280等,部分中景可切WF768等,大量远景可切WF512)
同一部4k 高码率 60帧,谈话镜头截图 。

中远景 帧如图

00468.jpg


虽然是WF1024 质量100%。
看不清眉毛啊。眼睛也模糊。

这种出来的是低质量的WF1024 00468_0.jpg
中近景 帧如图 。
01066.jpg
相同的WF1024,质量100%。
只因是近景切割而来。
居然看清眉毛,眼睛清晰。
也有明显嘴唇纹理

质量有很大提升
01066_0.jpg
若没有 沿用 梦版主的做法,对4k电视剧 选择优质码率,没有选择合适 近景,中景等细致分析。
而采用一刀切WF1024,其最大优势是省事。跑就完事了。
但是的结果是深远的。
就是 大量 一些低码率或 中远景 甚至快动作的小图 也切进来了。对外说是WF1024.
实质是 掺加了大量效果太差的1024.

其实我觉得若高码率近景的高清 如100分的足够,完全可以从源头切割近景。删除太差的1024 如20分。

从而让炼丹多用优质素材更准确,
减少炼丹压力。


故:真正的优质WF1024 应当以 4k高码率 中近景 人头像占屏幕一半以上,切WF1024,为佳。

下图 3840x2160. 红框是取图痕迹。 大约是 1300>1024.
00001  2.jpg

这样才能取的最佳的WF1024效果
V_000775_0.jpg



简言之,4k高码率 中近景先切WF1024,再筛选,之后炼丹 是非常不错提升炼丹速度和丹质量的途径。
(远古 1080就算了。基本一张清晰的都难找,WF512即可。有的看就不错了。)







回复 支持 1 反对 0

使用道具 举报

20

主题

499

帖子

5万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
51969

真我风采勋章

发表于 2023-9-6 08:52:07 | 显示全部楼层
本帖最后由 fanda 于 2023-9-6 08:58 编辑
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...


face_image = cv2.warpAffine(image, image_to_face_mat, (image_size, image_size), cv2.INTER_LANCZOS4)
原版确实
回复 支持 反对

使用道具 举报

20

主题

499

帖子

5万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
51969

真我风采勋章

发表于 2023-9-6 09:07:13 | 显示全部楼层
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...

chatgpt说的:
cv2.INTER_CUBIC和cv2.INTER_LANCZOS4是OpenCV中的两种插值方法,用于图像的缩放操作。它们之间的区别主要体现在插值算法的选择和图像质量的结果。

cv2.INTER_CUBIC是一种双立方插值算法。它会根据图像周围的像素值进行插值计算,通过对邻近像素的加权平均来生成新像素。这种插值方法适用于图像的放大缩放操作,可以提供较好的平滑效果。然而,双立方插值算法可能会导致一些细节的损失,尤其在进行较大放大时,可能会出现一些模糊或锯齿状的效果。

cv2.INTER_LANCZOS4是一种Lanczos插值算法,它使用了Lanczos滤波器来进行插值计算。Lanczos插值在图像放大缩小过程中保持了更多的细节,并提供了更好的锐利度。它通过在像素间进行加权计算来生成新像素,以保留更多的图像细节。相对于双立方插值,Lanczos插值算法更适用于图像放大的情况,可以提供更好的图像质量。

在实际应用中,选择合适的插值方法取决于具体的需求和应用场景。如果需要进行精细的图像放大或缩小操作,可以选择cv2.INTER_LANCZOS4以获得更好的图像质量。如果只需进行一般的图像缩放操作,并对计算速度要求较高,则cv2.INTER_CUBIC是一种较好的选择。根据实际情况,你可以尝试不同的插值方法来获得最适合你需求的结果。
回复 支持 1 反对 0

使用道具 举报

10

主题

454

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11432

可爱萌新勋章荣誉会员勋章小有贡献勋章

发表于 2023-9-6 10:41:37 | 显示全部楼层
本帖最后由 Hedwig 于 2023-9-6 10:42 编辑
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...
1.png
2.png


这四副图模拟了切图时的上采样和训练时的下采样后与原图的差值,不管是从人眼的直观感受还是从均值方差上都显示lanczos损失最小,你说的cubic最好的依据是什么?
回复 支持 反对

使用道具 举报

13

主题

994

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11934
发表于 2023-9-6 13:38:16 | 显示全部楼层
Hedwig 发表于 2023-9-6 10:41
这四副图模拟了切图时的上采样和训练时的下采样后与原图的差值,不管是从人眼的直观感受还是从均值方差 ...

1. 你肉眼没看出lanczos损失的细节最大?

2. 我们这里讨论的是对高清图进行切脸的问题,也就是切图的时候是下采样。我不知道你怎么模拟的,应该是第一次lanczos下采样,第二次cubic下采样。

回复 支持 反对

使用道具 举报

10

主题

454

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11432

可爱萌新勋章荣誉会员勋章小有贡献勋章

发表于 2023-9-6 14:04:03 | 显示全部楼层
seancai110 发表于 2023-9-6 13:38
1. 你肉眼没看出lanczos损失的细节最大?

2. 我们这里讨论的是对高清图进行切脸的问题,也就是切图的时 ...

1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024
然后训练时候又从1024下采样到模型分辨率,一次上一次下;
2.第一张是原图减去两次采样后的图,白点越多说明与原图差异越大,这不明显的lanczos白点最少嘛。
回复 支持 1 反对 0

使用道具 举报

6

主题

100

帖子

1968

积分

初级丹圣

Rank: 8Rank: 8

积分
1968
发表于 2023-9-6 14:43:37 | 显示全部楼层
Hedwig 发表于 2023-9-6 14:04
1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024
然后训练时候又从1024 ...

果子狸大哥,我之前听教授说PS的算法是最好的,但没明示是哪种算法。
PS里3种算法,cv2.INTER_NEAREST,cv2.INTER_LINEAR 和 cv2.INTER_CUBIC ,但我现在用PS cv2.INTER_CUBIC双三次插值进行缩放到模型分辨率,说真的,单凭肉眼很难分辨出哪种算法损失比较大,还请果子狸大哥指正下。
回复 支持 反对

使用道具 举报

13

主题

392

帖子

2621

积分

初级丹圣

Rank: 8Rank: 8

积分
2621
发表于 2023-9-6 14:54:20 | 显示全部楼层
对细节有用,但需要调用cpu,非gan的时候不用不切那么大
回复 支持 反对

使用道具 举报

13

主题

994

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11934
发表于 2023-9-6 15:32:48 | 显示全部楼层
本帖最后由 seancai110 于 2023-9-6 15:36 编辑
Hedwig 发表于 2023-9-6 14:04
1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024
然后训练时候又从1024 ...

我们讨论的是大于512的脸切成512,你自己下采样看吧。而且我都说了,dfl训练和合成的时候,是不用lanczos的。你这有放大又缩小,完全不是我们讨论的情况。

当然,我也希望有人真的实验一下。我比较懒,懒得写代码了。之前在网上看到一张下采样的对比照片,也没存。
回复 支持 反对

使用道具 举报

20

主题

497

帖子

4942

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4942

万事如意节日勋章

发表于 2023-9-6 17:29:56 | 显示全部楼层
seancai110 发表于 2023-9-6 04:17
dfl的resize功能好像也是用lanczos算法哦

没办法,我源图切的是head,如果切的是wf我直接用ps自带的功能压缩到丹分辨率最完美,不过依然比直接训练效果好
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-24 02:28 , Processed in 0.093643 second(s), 9 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表