deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 465|回复: 17

DFL 原版焕新:完美适配 RTX 30-50 系,算力性能翻倍!

[复制链接]

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 前天 00:25 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 iyuandou 于 2026-4-17 01:32 编辑

值此生日之际,感叹 DFL 已陪伴我三年。历经各路改版,始终觉得原版最纯粹,但原作者停更已久,TF1 框架与 CUDA 12.8 的脱节让 30/40/50 系显卡英雄无用武之地。
为此,我花了几天时间深度重构了原版代码。新版本全面拥抱 NVIDIA RTX 50 系列 (Blackwell),核心提升如下:
性能爆发: 训练速度提升 40% - 200%。
显存减负: 开启 bf16/fp32混合精度训练模式,显存占用降低 30% - 50%。
切脸加速: 优化提取算法,提速 50% - 300%(视显卡型号)。
优化预览: 通过鼠标滚轮放大缩小图像,方便查看细节。
技术说明:
因 TensorFlow 2.11 后不再原生支持 Windows GPU 构建,本版本基于 WSL2/Linux 环境运行,以突破官方限制,压榨新架构的极限性能。
使用门槛:
环境要求: 必须安装 WSL2 或在 Linux 原生环境下运行,Python 3.12.3+TensorFlow 2.21.0+CUDA12.8
操作基础: 需具备基础的 DFL 命令行操作经验。
适用人群: 强烈建议 30/40/50 系显卡用户升级,想通过 BF16/FP32 混合精度来换取更大 BS 或更快的训练速度,亦可尝试。

为爱发电,开源免费,如有同好者,欢迎交流请加  wx:iyd430
##  TF2版DeepFaceLab 深度学习环境配置与训练指南


## 一、 基础环境配置 (Windows 侧)

   1. 安装 WSL2: 打开 PowerShell 执行 wsl --install。
   2. 性能优化: 按 Win + R 输入 %UserProfile%,新建/编辑 .wslconfig 文件。建议配置如下:
   
   [wsl2]
   memory=32GB      # 建议为物理内存的 50%-75%
   swap=32GB        # 建议与内存等大,防止导出模型时 OOM
   processors=16    # 建议填入实际物理核心数
   
   修改后需重启 WSL: wsl --shutdown

## 二、 WSL 内部环境安装

# 1. 运行官方安装脚本
chmod +x setup_linux_native.sh && ./setup_linux_native.sh
# 2. 激活 GPU 运行环境
source activate_gpu.sh
# 3. 补全必要依赖 (FFmpeg)
sudo apt update && sudo apt install ffmpeg -y
pip install ffmpeg-python

## 三、 标准作业流程 (Workflow)
1. 素材预处理 (切脸)
根据显存调整并发数(16G 显存建议设置 2-3):

python main.py extract \
    --input-dir ~/workspace/data_dst \
    --output-dir ~/workspace/data_dst/aligned/ \
    --detector s3fd --jpeg-quality 100 --workers-per-gpu 2

2. 模型训练

python3 main.py train \
    --training-data-src-dir $HOME/workspace/data_src \
    --training-data-dst-dir $HOME/workspace/data_dst \
    --model-dir $HOME/workspace/model --model SAEHD

3. 模型导出与合成 (Merge)

* 导出 DFM: python main.py exportdfm --model-dir ~/workspace/model --model SAEHD
* 执行合成:

python main.py merge \
    --input-dir ~/workspace/data_dst \
    --output-dir ~/workspace/data_dst/merged \
    --output-mask-dir ~/workspace/data_dst/merged_mask \
    --aligned-dir ~/workspace/data_dst/aligned \
    --model-dir ~/workspace/model --model SAEHD

4. 导出成品视频

python main.py videoed video-from-sequence \
    --input-dir ~/workspace/data_dst/merged \
    --output-file ~/workspace/result.mp4 \
    --reference-file ~/workspace/data_dst.* \
    --include-audio

------------------------------
## 小贴士 (Tips)

* 自动补全依赖: 如果运行报错缺库,请统一执行 pip install -r requirements.txt。
* 路径检查: 命令中的 ~/workspace 为示例路径,请确保你的素材已放入对应文件夹。
* 性能调优: 训练时如果显存溢出(OOM),请在 train 命令中尝试调小 batch_size。




回复

使用道具 举报

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 昨天 01:15 | 显示全部楼层
本帖最后由 iyuandou 于 2026-4-18 01:17 编辑

优化预览显示文件名与loss值
https://dfldata.cc/forum.php?mod=viewthread&tid=21350
(出处: deepfacelab中文网)
256分辨率: ScreenShot_2026-04-18_010828_953.jpg
512分辨率: ScreenShot_2026-04-18_004944_109.jpg

使用方法:解压,覆盖同名文件
预览文件名及Loss补丁.tar (91.5 KB, 下载次数: 1)
回复 支持 反对

使用道具 举报

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 昨天 18:21 | 显示全部楼层

新增偏航筛选功能

本帖最后由 iyuandou 于 2026-4-18 18:27 编辑

新增偏航筛选功能
##设计初衷:
1、解决SRC/DST同一偏航角度中大量重复脸图,影响训练效率
2、筛选出缺少的角度图片,方便补充
3、解决同人不同SRC的合并
## 核心功能
### 1. 按偏航角分组抽取
- 角度分组 :将人脸按偏航角度(yaw)分为 128 个等分组
- 自定义抽取数量 :用户可通过 --imgs-per-group 参数指定每组抽取的图片数量
- 源人脸匹配 :对源人脸按相同分组抽取相同数量的图片
- 缺失组处理 :检测源人脸缺失或数量不足的角度组,将对应组的目标人脸复制到"缺少角度"目录
### 2. 功能增强
- 俯仰角度分组 :支持通过 --pitch-groups 参数设置俯仰角度的分组数量(1-20)
- 图像质量评估 :使用拉普拉斯算子计算图像清晰度,优先选择高质量人脸
- 智能排序 :可选择基于图像质量和角度的综合排序,或仅按角度排序
### 3. 性能优化
- 多进程并行处理 :使用 FaceProcessorSubprocessor 类实现多进程并行处理,充分利用 CPU 核心
- GPU 加速 :支持使用 TensorFlow GPU 加速图像质量评估,速度提升 3-10 倍
- 缓存机制 :实现基于 JSON 文件的缓存系统,存储人脸角度和质量分数,避免重复计算,后续运行速度提升 10-100 倍,几乎瞬间完成
- 智能缓存管理 :只处理未缓存的数据,已缓存的数据直接从缓存中读取
### 4. 目录结构说明
- 训练目标人脸 :存放筛选出来的目标人脸图片
- 训练源人脸 :存放筛选出来的源人脸图片
- 缺少角度 :存放源人脸缺失或数量不足的角度组对应的目标人脸图片
- 原始文件保留 :保留原始文件,只是将筛选出来的图片复制到新目录
## 使用方法
- 运行 python main.py sort --input-dir path/to/target/faces
- 选择 yaw group extraction 选项
- 输入源人脸目录(可选)
- 输入每组抽取的图片数量
- 输入俯仰角度分组数量
- 选择是否基于图像质量排序
- 选择是否使用 GPU 加速

ScreenShot_2026-04-18_175854_162.jpg

新增偏航筛选功能.tar (86 KB, 下载次数: 2)   解压,覆盖同名文件
回复 支持 反对

使用道具 举报

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 前天 00:29 | 显示全部楼层
本帖最后由 iyuandou 于 2026-4-17 14:59 编辑

遮罩训练正常:
启动命令:
python main.py train --training-data-src-dir ~/workspace/data_src/aligned --training-data-dst-dir ~/workspace/data_dst/aligned --model-dir ~/workspace/model --model XSeg


713fc172-615d-4f5f-8c4b-2fb74a021a0a.png

回复 支持 反对

使用道具 举报

4

主题

35

帖子

443

积分

初级丹师

Rank: 3Rank: 3

积分
443
发表于 前天 04:39 | 显示全部楼层
支持老铁
回复

使用道具 举报

49

主题

368

帖子

5137

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5137

万事如意节日勋章

发表于 前天 06:53 | 显示全部楼层
都修改了哪些文件,有清单吗?
回复 支持 反对

使用道具 举报

0

主题

121

帖子

2509

积分

初级丹圣

Rank: 8Rank: 8

积分
2509

万事如意节日勋章

发表于 前天 07:32 | 显示全部楼层
开源免费
请问开源项目地址多少?
回复 支持 反对

使用道具 举报

0

主题

22

帖子

1196

积分

初级丹圣

Rank: 8Rank: 8

积分
1196
发表于 前天 08:55 | 显示全部楼层
支持大佬~!
回复

使用道具 举报

15

主题

1994

帖子

3万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
31268

万事如意节日勋章开心娱乐节日勋章

发表于 前天 09:37 | 显示全部楼层
感谢分享。马上下载
回复 支持 反对

使用道具 举报

8

主题

128

帖子

2741

积分

初级丹圣

Rank: 8Rank: 8

积分
2741

万事如意节日勋章

发表于 前天 13:30 | 显示全部楼层
支持,祝你生日快乐,发大财~
回复 支持 反对

使用道具 举报

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 前天 15:03 | 显示全部楼层
july 发表于 2026-4-17 07:32
开源免费
请问开源项目地址多少?

压缩包里是源代码
回复 支持 反对

使用道具 举报

28

主题

197

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
12673
 楼主| 发表于 前天 15:17 | 显示全部楼层
毕加索 发表于 2026-4-17 13:30
支持,祝你生日快乐,发大财~

谢谢
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2026-4-19 23:42 , Processed in 0.129807 second(s), 42 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表