deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
123
返回列表 发新帖
楼主: lispmox

在图像潜空间跑DFL,期望用更少的资源跑高画质

[复制链接]

7

主题

64

帖子

4572

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4572
 楼主| 发表于 2025-5-9 20:30:03 | 显示全部楼层
sex871 发表于 2025-5-9 19:55
大佬有没有考虑参考教授的Ro-1优化器优化你的版本哇,目前24G玩416以上还是离不开ICE啊 ...

我只是玩玩比不上专业做这个的大佬。Ro-1优化器的细节我也不清楚,如果只是支持任意大小的bs,我手里的版本也是可以通过梯度累积做到的。我理解跑416以上分辨率已经不仅仅是模型架构的问题了,和训练方式,损失函数都有关系。ICE对这块能支持到什么程度,我完全不了解,教授那个群我至今没混进去。
回复 支持 反对

使用道具 举报

3

主题

65

帖子

1640

积分

初级丹圣

Rank: 8Rank: 8

积分
1640
发表于 2025-5-9 21:23:16 | 显示全部楼层
lispmox 发表于 2025-5-9 16:59
并不完全是,我是参考SD的思路,在图像潜空间里训练。SD会单独训练一个VAE变分自编码器来压缩图像,比如SD ...

faceswap中,不倫什麼模型,都可以自定義編碼器的輸入。可以X入 Y出。例如64/128入 256/512/1080出。
還有很多高級設置,可以對編碼器 FC層 解碼器參數修改,滿足個性化需求。簡單說你可以自己打造設定一個模型架構,不像DFL傻瓜式的幾個參數的開和關。
回复 支持 反对

使用道具 举报

7

主题

136

帖子

1050

积分

初级丹圣

Rank: 8Rank: 8

积分
1050

万事如意节日勋章

发表于 2025-5-9 22:51:05 | 显示全部楼层
厉害,发出来帮你测试一下
回复 支持 反对

使用道具 举报

7

主题

136

帖子

1050

积分

初级丹圣

Rank: 8Rank: 8

积分
1050

万事如意节日勋章

发表于 2025-5-9 23:06:30 | 显示全部楼层
大佬,可以修改为支持bf16和tf32精度训练吗?这样可以节约显存提高训练速度,实际精度还是够用的。
回复 支持 反对

使用道具 举报

7

主题

64

帖子

4572

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4572
 楼主| 发表于 7 天前 | 显示全部楼层
本帖最后由 lispmox 于 2025-5-10 00:53 编辑
mjy9921130 发表于 2025-5-9 23:06
大佬,可以修改为支持bf16和tf32精度训练吗?这样可以节约显存提高训练速度,实际精度还是够用的。 ...

我现在的代码,bf16会不收敛,fp16会直接nan。我暂时还没debug,等我有空再说,推测是dense层和dssim这些有大kernel的卷积层需要暂时关闭混合精度。
tf32只需要一下cudnn的启动参数就行了吧,这个倒是可以支持,等有空测测效果吧。
回复 支持 反对

使用道具 举报

5

主题

57

帖子

399

积分

初级丹师

Rank: 3Rank: 3

积分
399
发表于 7 天前 | 显示全部楼层
大佬牛逼
回复

使用道具 举报

13

主题

1114

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
14260
发表于 7 天前 | 显示全部楼层
lispmox 发表于 2025-5-9 17:56
这个思路可以的,期待大佬的研究结果。我是在训练之前先用liveportrait扩充了海量的眼神角度啥的。数据量 ...

对啊。与其准备这么多素材,浪费时间训练,结果还不好控制。还不如在合成之后再解决眼神问题。在comfyui里搭个工作流,用liveportrait把合成的图片和dst对一遍眼神,然后再输出视频
回复 支持 反对

使用道具 举报

7

主题

136

帖子

1050

积分

初级丹圣

Rank: 8Rank: 8

积分
1050

万事如意节日勋章

发表于 7 天前 | 显示全部楼层
本帖最后由 mjy9921130 于 2025-5-10 07:31 编辑
lispmox 发表于 2025-5-10 00:50
我现在的代码,bf16会不收敛,fp16会直接nan。我暂时还没debug,等我有空再说,推测是dense层和dssim这些 ...

可以考虑前期bf16,后期切换到tf32。我目前用的一个软件,支持在训练中直接切换精度,可惜不开源,最高分辨率只支持384。好多参数也可以在正在训练过程中重新选择打开或关闭。mve-pytorch-trainer-1.3.0版本下载地址 - 【deepfacelab】综合讨论- AIBL论坛-AI技术交流社区。你的改版可以私发一份我试试吗?显卡小显存又想用大模型。如果配合你这个思路,再可以前期用bf16跑,后期改tf32收敛,显存就能大大节省了。
回复 支持 反对

使用道具 举报

15

主题

1933

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
29144

万事如意节日勋章开心娱乐节日勋章

发表于 6 天前 | 显示全部楼层
期待最终结果
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-5-17 12:16 , Processed in 0.114514 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表