deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 504|回复: 27

所谓的50系DFL现在根本就没实现

[复制链接]

44

主题

586

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
23051
 楼主| 发表于 前天 01:09 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 dfl9999 于 2025-10-13 08:15 编辑

Snipaste_2025-10-13_00-51-24.jpg

怀着沉痛的心情写下这些,把4090D卖了换5090D期待的提升根本没有,换了几个支持50系的DFL版本,训练延迟从40系的500MS飙升到1300MS,安装了所谓的CUDA12.8和CUDNN 9,提升到1200MS,后来狗急跳墙尝试开启FP16,50系不是最擅长的FP16吗,显存使用量马上减少了一半,悲剧的是DFL的进程跟FP16的CUDA上下文都没办法衔接,软件变成了一个单进程软件,所有操作回退到单进程,一核有难31核围观,延迟也FP32的1200MS变成77秒,终于知道修改者和作者为什么要把FP16注释掉了,因为DFL底层架构上就是一个FP32软件,不支持混合精度,当现在所有AI软件都转向FP16迈向FP8的时候,DFL在FP32上止步了,除非有大神完成FP16的适配,目前勉强能用的FP32精度的1200MS延迟我是绝对不能接受的,而50系又是FP16优化的,让50系去运行FP32就是让李逵去绣花,显存使用跟40系版本比起来也超级加倍,速度减半,手上还有40系卡还想用DFL的别急着换卡,目前的情况就是一坨,像我这种庸人的努力在绝对的技术鸿沟面前都是笑话,手上有50卡又实在想用的,可以下载论坛的DeepFaceLab_NVIDIA_RTX5000_RTX4000 Pytorch 1.4.2个人免费版

评分

参与人数 1贡献 +1 收起 理由
毕加索 + 1 不错的信息!

查看全部评分

回复

使用道具 举报

15

主题

3535

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19447

真我风采勋章万事如意节日勋章

发表于 前天 08:19 | 显示全部楼层
本帖最后由 wtxx8888 于 2025-10-13 08:41 编辑

用DX12版啊。都不至于,增加这么多延迟吧?
回复 支持 反对

使用道具 举报

1

主题

10

帖子

1090

积分

初级丹圣

Rank: 8Rank: 8

积分
1090
发表于 前天 15:47 | 显示全部楼层
悲剧!!!同情楼主。就担心这类换脸软件不更新,逐渐的会有版本落后的问题。按照你说的,那买新显卡,就不要太考虑这类软件的因素。否则不如买旧的4090,因为我这些天了解,似乎就是,显存大比40到50更重要。但我又绝对不会买旧东西的。所以,50系差不多的就凑活了。也不是纯用ai。
回复 支持 反对

使用道具 举报

44

主题

586

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
23051
 楼主| 发表于 前天 17:29 | 显示全部楼层
本帖最后由 dfl9999 于 2025-10-13 17:31 编辑
wtxx8888 发表于 2025-10-13 08:19
用DX12版啊。都不至于,增加这么多延迟吧?

目前50系的那几个版本把自带的cuda库升级到12.8、cudnn升级到9.0都没用,操作系统的cuda和cudnn环境我也安装了,老外6月份的那个版本我也试了,只是可以跑的水平,显存使用量也暴涨,32g都不够,1300ms是不能接受的,同样跑fp32精度的模型50系应该是比40系快30%以上的,所以肯定是哪个环节适配出问题了,我用40系跑了一堆模型现在都不能,torch的那个版本在我电脑上又有端口套接字bug用不了,又回头去用ice了,ice目前完美适配50系……目前吧里唯一能解决这个问题的估计只有你了,可惜你没有50系的卡……
回复 支持 反对

使用道具 举报

44

主题

586

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
23051
 楼主| 发表于 前天 18:03 | 显示全部楼层
wtxx8888 发表于 2025-10-13 08:19
用DX12版啊。都不至于,增加这么多延迟吧?

dx12版延迟勉强能接受,从500ms增加到700ms……
回复 支持 反对

使用道具 举报

15

主题

3535

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
19447

真我风采勋章万事如意节日勋章

发表于 前天 19:37 | 显示全部楼层
本帖最后由 wtxx8888 于 2025-10-13 20:01 编辑
dfl9999 发表于 2025-10-13 18:03
dx12版延迟勉强能接受,从500ms增加到700ms……

凑合DX12吧,显存大了,玩玩其他的AI吧。
主要tensorflow恶心,最高就支持CUDA到12.4,后继不再支持WIN。
回复 支持 反对

使用道具 举报

2

主题

65

帖子

1890

积分

初级丹圣

Rank: 8Rank: 8

积分
1890

万事如意节日勋章

发表于 前天 20:26 | 显示全部楼层
dfl9999 发表于 2025-10-13 17:29
目前50系的那几个版本把自带的cuda库升级到12.8、cudnn升级到9.0都没用,操作系统的cuda和cudnn环境我也安 ...

什么BUG,反馈给更新Pytorch的JesterX大神研究下
回复 支持 反对

使用道具 举报

44

主题

586

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
23051
 楼主| 发表于 前天 20:32 | 显示全部楼层
本帖最后由 dfl9999 于 2025-10-13 20:37 编辑
小王子 发表于 2025-10-13 20:26
什么BUG,反馈给更新Pytorch的JesterX大神研究下

DFL PYTORCH版本训练报错Starting trainer - Personal Edition
Src path: E:\deep\pytorch-build\workspace\data_src\aligned
Model path: E:\deep\pytorch-build\workspace\model
Pretrain folder: E:\deep\pytorch-build\workspace\pretrain
Config path: E:\deep\pytorch-build\saehd_config.yaml
Current version: 1.4.2
Error: Cannot connect to update server.
========================================================================================================================
name: 1                        archi: df-ud                   resolution: 256                ae_dims: 256
e_dims: 64                     d_dims: 64                     d_mask_dims: 22                face_type: wf
growing_stage: 0               use_cache: True                cache_masks: True              image_type: jpg
image_quality: 1               force_recache: False           folder_suffix: .face_cache_    mp_mode: full
train_mask: True               pin_samples: True              autobackup_hour: 0             maximum_n_backups: 24
batch_size: 8                  batch_dst_mixing: 0.0          masked_training: True          eye_mouth_priority: False
blur_out_mask: False           uniform_yaw: False             lr: 5e-05                      lr_dropout: False
cpu_cap: 6                     clipgrad: False                keep_graph: False              loss: ssim
weight_decay: 0.0005           snapshot_interval: 5000        random_warp: True              random_noise: False
random_src_flip: False         random_dst_flip: True          color_augmentation: True       scale_range: 0.15
rotation_range: 2              tx_range: 0.05                 ty_range: 0.05                 gan_training: False
gan_fix: True                  gan_power: 0.01                gan_dims: 16                   gan_patch_size: 64
gan_weight_decay: 0.001        gan_smoothing: 0.3             gan_noise: 0.01
========================================================================================================================
API address: http://localhost:8000/
以一种访问权限不允许的方式做了一个访问套接字的尝试。

然后训练就终止了,我试过关防火墙、关安全软件、换端口、禁用api、重置网络、禁用ipv6、右键管理员运行都不行,搞了两天已经绝望了,我看了8000端口是软件自己的python进程在使用,显卡5090d,已经绝望了
回复 支持 反对

使用道具 举报

0

主题

9

帖子

89

积分

高级丹童

Rank: 2

积分
89
发表于 前天 20:33 | 显示全部楼层
期待优化版,我的50系一样
回复 支持 反对

使用道具 举报

44

主题

586

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
23051
 楼主| 发表于 前天 20:44 | 显示全部楼层
wtxx8888 发表于 2025-10-13 19:37
凑合DX12吧,显存大了,玩玩其他的AI吧。
主要tensorflow恶心,最高就支持CUDA到12.4,后继不再支持WIN。
...

32g小水管玩wan2.2一样坐牢,可能pytorch版本是唯一能围魏救赵的方法,可惜在我电脑上有bug解决不了,目前只能把n卡当a卡用了
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-10-15 18:28 , Processed in 0.112013 second(s), 38 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表