deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1611|回复: 24

aligned分辨率多少合适

[复制链接]

16

主题

399

帖子

3859

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3859

万事如意节日勋章

 楼主| 发表于 2023-9-5 21:55:53 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
如题,请问src切1024会比512清晰吗,有无必要?另外,可否dst切512、src切1024,这样搭配训练会不合适吗?

回复

使用道具 举报

13

主题

994

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11934
发表于 2023-9-5 23:04:01 | 显示全部楼层
DFLive 发表于 2023-9-5 22:52
多谢,只是不知按照模型分辨率压缩回去之后,这些纹理的损失有多大。 ...

是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以切脸尽量大图。
然而,在训练和合成的时候,DFL用的是cubic算法,放大缩小效果比较均衡。
这就造成同样高清截图,切1024经过两次缩放的效果,比切512经过两次缩放的效果好。

但是,1024的图在cpu比较差的电脑上,会出现cpu跑满,gpu的cuda跑不满的情况,因为缩放是用cpu。
所以会写代码的直接把DFL工程里的所有lanczos算法替换成cubic,可以一劳永逸。这样切512够用了。
回复 支持 2 反对 0

使用道具 举报

10

主题

454

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11432

可爱萌新勋章荣誉会员勋章小有贡献勋章

发表于 2023-9-6 14:04:03 | 显示全部楼层
seancai110 发表于 2023-9-6 13:38
1. 你肉眼没看出lanczos损失的细节最大?

2. 我们这里讨论的是对高清图进行切脸的问题,也就是切图的时 ...

1.我这模拟的是非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024
然后训练时候又从1024下采样到模型分辨率,一次上一次下;
2.第一张是原图减去两次采样后的图,白点越多说明与原图差异越大,这不明显的lanczos白点最少嘛。
回复 支持 1 反对 0

使用道具 举报

20

主题

499

帖子

5万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
51969

真我风采勋章

发表于 2023-9-6 09:07:13 | 显示全部楼层
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...

chatgpt说的:
cv2.INTER_CUBIC和cv2.INTER_LANCZOS4是OpenCV中的两种插值方法,用于图像的缩放操作。它们之间的区别主要体现在插值算法的选择和图像质量的结果。

cv2.INTER_CUBIC是一种双立方插值算法。它会根据图像周围的像素值进行插值计算,通过对邻近像素的加权平均来生成新像素。这种插值方法适用于图像的放大缩放操作,可以提供较好的平滑效果。然而,双立方插值算法可能会导致一些细节的损失,尤其在进行较大放大时,可能会出现一些模糊或锯齿状的效果。

cv2.INTER_LANCZOS4是一种Lanczos插值算法,它使用了Lanczos滤波器来进行插值计算。Lanczos插值在图像放大缩小过程中保持了更多的细节,并提供了更好的锐利度。它通过在像素间进行加权计算来生成新像素,以保留更多的图像细节。相对于双立方插值,Lanczos插值算法更适用于图像放大的情况,可以提供更好的图像质量。

在实际应用中,选择合适的插值方法取决于具体的需求和应用场景。如果需要进行精细的图像放大或缩小操作,可以选择cv2.INTER_LANCZOS4以获得更好的图像质量。如果只需进行一般的图像缩放操作,并对计算速度要求较高,则cv2.INTER_CUBIC是一种较好的选择。根据实际情况,你可以尝试不同的插值方法来获得最适合你需求的结果。
回复 支持 1 反对 0

使用道具 举报

15

主题

1936

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
26150

万事如意节日勋章

发表于 2023-9-6 08:24:04 | 显示全部楼层
本帖最后由 come3002 于 2023-9-6 15:37 编辑
DFLive 发表于 2023-9-5 22:52
多谢,只是不知按照模型分辨率压缩回去之后,这些纹理的损失有多大。 ...

不清楚。
1024下 既然能看到嘴唇纹理。就可以在实际操作中选出一批优质素材假如 100分。
用 纯100分的做主体 炼 细节自然要快一些。另外出好细节
001051908_0.jpg



1024 下都看不对清晰上牙齿齿缝 假如是20分,数量占一半。
被掺加到炼丹资源中。使得分数为100-20分
那么炼丹时候,dfl就要既跟100分学,也跟20分学。假如20分的低质量比例高,一来拖慢 牙齿等炼丹速度。
二来 20分的素材较多时候,会明显拉低或影响作品质量

360截图20230905151137013.jpg


360截图20230905151156660.jpg

360截图20230905151210538.jpg

360截图20230905151449083.jpg

看到大佬一句话,深有体会
非贴脸镜头原尺寸没达到1024但是要切1024的脸,比如768上采样到1024“
分析:
至于 为什么会WF1024 出现如此模糊图片。一方面是动作快。一个是码率低
另一个方面是 某种原因,大多数坛友 采用的办法是直接对4k剧/切割。
一部剧总有 高码率,低码率;镜头也有不同(少量近景可切WF1280等,部分中景可切WF768等,大量远景可切WF512)
同一部4k 高码率 60帧,谈话镜头截图 。

中远景 帧如图

00468.jpg


虽然是WF1024 质量100%。
看不清眉毛啊。眼睛也模糊。

这种出来的是低质量的WF1024 00468_0.jpg
中近景 帧如图 。
01066.jpg
相同的WF1024,质量100%。
只因是近景切割而来。
居然看清眉毛,眼睛清晰。
也有明显嘴唇纹理

质量有很大提升
01066_0.jpg
若没有 沿用 梦版主的做法,对4k电视剧 选择优质码率,没有选择合适 近景,中景等细致分析。
而采用一刀切WF1024,其最大优势是省事。跑就完事了。
但是的结果是深远的。
就是 大量 一些低码率或 中远景 甚至快动作的小图 也切进来了。对外说是WF1024.
实质是 掺加了大量效果太差的1024.

其实我觉得若高码率近景的高清 如100分的足够,完全可以从源头切割近景。删除太差的1024 如20分。

从而让炼丹多用优质素材更准确,
减少炼丹压力。


故:真正的优质WF1024 应当以 4k高码率 中近景 人头像占屏幕一半以上,切WF1024,为佳。

下图 3840x2160. 红框是取图痕迹。 大约是 1300>1024.
00001  2.jpg

这样才能取的最佳的WF1024效果
V_000775_0.jpg



简言之,4k高码率 中近景先切WF1024,再筛选,之后炼丹 是非常不错提升炼丹速度和丹质量的途径。
(远古 1080就算了。基本一张清晰的都难找,WF512即可。有的看就不错了。)







回复 支持 1 反对 0

使用道具 举报

16

主题

399

帖子

3859

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3859

万事如意节日勋章

 楼主| 发表于 2023-9-5 21:57:06 | 显示全部楼层
如果512分辨率就够了,那坛友切1024的意义在哪呢?
回复 支持 反对

使用道具 举报

11

主题

118

帖子

2683

积分

初级丹圣

Rank: 8Rank: 8

积分
2683

万事如意节日勋章

发表于 2023-9-5 22:07:22 | 显示全部楼层
DFLive 发表于 2023-9-5 21:57
如果512分辨率就够了,那坛友切1024的意义在哪呢?

方便分图,模糊图1024对比太明显,512分高清图看瞎眼睛,1024出效果很快,有细节多了,gan0.1,找了2000千张上下牙齿2000高清侧脸,开个20万基本上下牙齿,侧脸都不错了,上个月看了一位大佬教程,才知道1024的好处
回复 支持 反对

使用道具 举报

15

主题

1936

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
26150

万事如意节日勋章

发表于 2023-9-5 22:12:51 | 显示全部楼层
本帖最后由 come3002 于 2023-9-5 22:16 编辑
DFLive 发表于 2023-9-5 21:57
如果512分辨率就够了,那坛友切1024的意义在哪呢?

远古资源 很多是1080p。只能切WF512.
最近大量4k流出。
4k 3860x2160.  一般近景 推荐切WF1024.
能尽量保留更多有效信息。比如 嘴唇纹理。下牙齿齿缝啊。

00001  2.jpg

Z01043_0.jpg
V_000767_0.jpg

04241_0.jpg

回复 支持 反对

使用道具 举报

16

主题

399

帖子

3859

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3859

万事如意节日勋章

 楼主| 发表于 2023-9-5 22:50:58 | 显示全部楼层
1427523462 发表于 2023-9-5 22:07
方便分图,模糊图1024对比太明显,512分高清图看瞎眼睛,1024出效果很快,有细节多了,gan0.1,找了2000千 ...

多谢,验证了猜想!
回复 支持 反对

使用道具 举报

16

主题

399

帖子

3859

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3859

万事如意节日勋章

 楼主| 发表于 2023-9-5 22:52:40 | 显示全部楼层
come3002 发表于 2023-9-5 22:12
远古资源 很多是1080p。只能切WF512.
最近大量4k流出。
4k 3860x2160.  一般近景 推荐切WF1024.

多谢,只是不知按照模型分辨率压缩回去之后,这些纹理的损失有多大。
回复 支持 反对

使用道具 举报

16

主题

399

帖子

3859

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3859

万事如意节日勋章

 楼主| 发表于 2023-9-5 23:37:48 | 显示全部楼层
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...

说得很到位,统一算法是个问题。
回复 支持 反对

使用道具 举报

20

主题

497

帖子

4942

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4942

万事如意节日勋章

发表于 2023-9-6 02:09:37 | 显示全部楼层
seancai110 发表于 2023-9-5 23:04
是DFL代码的历史遗留问题。
DFL切脸和resize用的缩放是lanczos算法,放大效果好,但是缩小效果很差。所以 ...

其实都不如保持脸图和丹分辨率一致,我都是直接resize到丹的分辨率再训练
回复 支持 反对

使用道具 举报

13

主题

994

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
11934
发表于 2023-9-6 04:17:15 | 显示全部楼层
丸丸 发表于 2023-9-6 02:09
其实都不如保持脸图和丹分辨率一致,我都是直接resize到丹的分辨率再训练 ...

dfl的resize功能好像也是用lanczos算法哦
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-24 02:22 , Processed in 0.126012 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表