aligned分辨率多少合适

come3002 · 发表于 2023-9-6 08:24:04

本帖最后由 come3002 于 2023-9-6 15:37 编辑

DFLive 发表于 2023-9-5 22:52
多谢，只是不知按照模型分辨率压缩回去之后，这些纹理的损失有多大。 ...

不清楚。
1024下既然能看到嘴唇纹理。就可以在实际操作中选出一批优质素材假如 100分。
用纯100分的做主体炼细节自然要快一些。另外出好细节

1024 下都看不对清晰上牙齿齿缝假如是20分，数量占一半。
被掺加到炼丹资源中。使得分数为100-20分
那么炼丹时候，dfl就要既跟100分学，也跟20分学。假如20分的低质量比例高，一来拖慢牙齿等炼丹速度。
二来 20分的素材较多时候，会明显拉低或影响作品质量

360截图20230905151137013.jpg

看到大佬一句话，深有体会
”非贴脸镜头原尺寸没达到1024但是要切1024的脸，比如768上采样到1024“
分析：
至于为什么会WF1024 出现如此模糊图片。一方面是动作快。一个是码率低
另一个方面是某种原因，大多数坛友采用的办法是直接对4k剧/切割。
一部剧总有高码率，低码率；镜头也有不同（少量近景可切WF1280等，部分中景可切WF768等，大量远景可切WF512）
同一部4k 高码率 60帧，谈话镜头截图。
中远景帧如图

虽然是WF1024 质量100%。
看不清眉毛啊。眼睛也模糊。
这种出来的是低质量的WF1024

中近景帧如图。

相同的WF1024，质量100%。
只因是近景切割而来。
居然看清眉毛，眼睛清晰。
也有明显嘴唇纹理
质量有很大提升

若没有沿用梦版主的做法，对4k电视剧选择优质码率，没有选择合适近景，中景等细致分析。
而采用一刀切WF1024，其最大优势是省事。跑就完事了。
但是的结果是深远的。
就是大量一些低码率或中远景甚至快动作的小图也切进来了。对外说是WF1024.
实质是掺加了大量效果太差的1024.

其实我觉得若高码率近景的高清如100分的足够，完全可以从源头切割近景。删除太差的1024 如20分。
从而让炼丹多用优质素材更准确，
减少炼丹压力。

故：真正的优质WF1024 应当以 4k高码率中近景人头像占屏幕一半以上，切WF1024，为佳。

下图 3840x2160. 红框是取图痕迹。大约是 1300＞1024.
00001 2.jpg

这样才能取的最佳的WF1024效果

简言之，4k高码率中近景先切WF1024，再筛选，之后炼丹是非常不错提升炼丹速度和丹质量的途径。
（远古 1080就算了。基本一张清晰的都难找，WF512即可。有的看就不错了。）

fanda · 发表于 2023-9-6 08:52:07

本帖最后由 fanda 于 2023-9-6 08:58 编辑

seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法，放大效果好，但是缩小效果很差。所以 ...

face_image = cv2.warpAffine(image, image_to_face_mat, (image_size, image_size), cv2.INTER_LANCZOS4)
原版确实

fanda · 发表于 2023-9-6 09:07:13

seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法，放大效果好，但是缩小效果很差。所以 ...

chatgpt说的：
cv2.INTER_CUBIC和cv2.INTER_LANCZOS4是OpenCV中的两种插值方法，用于图像的缩放操作。它们之间的区别主要体现在插值算法的选择和图像质量的结果。

cv2.INTER_CUBIC是一种双立方插值算法。它会根据图像周围的像素值进行插值计算，通过对邻近像素的加权平均来生成新像素。这种插值方法适用于图像的放大缩放操作，可以提供较好的平滑效果。然而，双立方插值算法可能会导致一些细节的损失，尤其在进行较大放大时，可能会出现一些模糊或锯齿状的效果。

cv2.INTER_LANCZOS4是一种Lanczos插值算法，它使用了Lanczos滤波器来进行插值计算。Lanczos插值在图像放大缩小过程中保持了更多的细节，并提供了更好的锐利度。它通过在像素间进行加权计算来生成新像素，以保留更多的图像细节。相对于双立方插值，Lanczos插值算法更适用于图像放大的情况，可以提供更好的图像质量。

在实际应用中，选择合适的插值方法取决于具体的需求和应用场景。如果需要进行精细的图像放大或缩小操作，可以选择cv2.INTER_LANCZOS4以获得更好的图像质量。如果只需进行一般的图像缩放操作，并对计算速度要求较高，则cv2.INTER_CUBIC是一种较好的选择。根据实际情况，你可以尝试不同的插值方法来获得最适合你需求的结果。

Hedwig · 发表于 2023-9-6 10:41:37

本帖最后由 Hedwig 于 2023-9-6 10:42 编辑

seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法，放大效果好，但是缩小效果很差。所以 ...

这四副图模拟了切图时的上采样和训练时的下采样后与原图的差值，不管是从人眼的直观感受还是从均值方差上都显示lanczos损失最小，你说的cubic最好的依据是什么？

seancai110 · 发表于 2023-9-6 13:38:16

Hedwig 发表于 2023-9-6 10:41
这四副图模拟了切图时的上采样和训练时的下采样后与原图的差值，不管是从人眼的直观感受还是从均值方差 ...

1. 你肉眼没看出lanczos损失的细节最大？

2. 我们这里讨论的是对高清图进行切脸的问题，也就是切图的时候是下采样。我不知道你怎么模拟的，应该是第一次lanczos下采样，第二次cubic下采样。

Hedwig · 发表于 2023-9-6 14:04:03

seancai110 发表于 2023-9-6 13:38
1. 你肉眼没看出lanczos损失的细节最大？

2. 我们这里讨论的是对高清图进行切脸的问题，也就是切图的时 ...

1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸，比如768上采样到1024
然后训练时候又从1024下采样到模型分辨率，一次上一次下；
2.第一张是原图减去两次采样后的图，白点越多说明与原图差异越大，这不明显的lanczos白点最少嘛。

深海鳕鱼 · 发表于 2023-9-6 14:43:37

Hedwig 发表于 2023-9-6 14:04
1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸，比如768上采样到1024
然后训练时候又从1024 ...

果子狸大哥，我之前听教授说PS的算法是最好的，但没明示是哪种算法。
PS里3种算法，cv2.INTER_NEAREST，cv2.INTER_LINEAR 和 cv2.INTER_CUBIC ，但我现在用PS cv2.INTER_CUBIC双三次插值进行缩放到模型分辨率，说真的，单凭肉眼很难分辨出哪种算法损失比较大，还请果子狸大哥指正下。

htyy · 发表于 2023-9-6 14:54:20

对细节有用，但需要调用cpu，非gan的时候不用不切那么大

seancai110 · 发表于 2023-9-6 15:32:48

本帖最后由 seancai110 于 2023-9-6 15:36 编辑

Hedwig 发表于 2023-9-6 14:04
1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸，比如768上采样到1024
然后训练时候又从1024 ...

我们讨论的是大于512的脸切成512，你自己下采样看吧。而且我都说了，dfl训练和合成的时候，是不用lanczos的。你这有放大又缩小，完全不是我们讨论的情况。

当然，我也希望有人真的实验一下。我比较懒，懒得写代码了。之前在网上看到一张下采样的对比照片，也没存。

丸丸 · 发表于 2023-9-6 17:29:56

seancai110 发表于 2023-9-6 04:17
dfl的resize功能好像也是用lanczos算法哦

没办法，我源图切的是head，如果切的是wf我直接用ps自带的功能压缩到丹分辨率最完美，不过依然比直接训练效果好

		自动登录	找回密码
密码			立即注册（仅限QQ邮箱）

aligned分辨率多少合适

万事如意节日勋章

开心娱乐节日勋章

真我风采勋章

可爱萌新勋章

荣誉会员勋章

小有贡献勋章