DFL 原版焕新：完美适配 RTX 30-50 系，算力性能翻倍！

iyuandou · 发表于 2026-4-17 00:25:43

星级打分

1
2
3
4
5

平均分:5 参与人数:1 我的评分:未评

本帖最后由 iyuandou 于 2026-4-17 01:32 编辑

值此生日之际，感叹 DFL 已陪伴我三年。历经各路改版，始终觉得原版最纯粹，但原作者停更已久，TF1 框架与 CUDA 12.8 的脱节让 30/40/50 系显卡英雄无用武之地。
为此，我花了几天时间深度重构了原版代码。新版本全面拥抱 NVIDIA RTX 50 系列 (Blackwell)，核心提升如下：
性能爆发：训练速度提升 40% - 200%。
显存减负：开启 bf16/fp32混合精度训练模式，显存占用降低 30% - 50%。
切脸加速：优化提取算法，提速 50% - 300%（视显卡型号）。
优化预览：通过鼠标滚轮放大缩小图像，方便查看细节。
技术说明：
因 TensorFlow 2.11 后不再原生支持 Windows GPU 构建，本版本基于 WSL2/Linux 环境运行，以突破官方限制，压榨新架构的极限性能。
使用门槛：
环境要求：必须安装 WSL2 或在 Linux 原生环境下运行，Python 3.12.3+TensorFlow 2.21.0+CUDA12.8
操作基础：需具备基础的 DFL 命令行操作经验。
适用人群：强烈建议 30/40/50 系显卡用户升级，想通过 BF16/FP32 混合精度来换取更大 BS 或更快的训练速度，亦可尝试。

为爱发电，开源免费，如有同好者，欢迎交流请加  wx:iyd430
##  TF2版DeepFaceLab 深度学习环境配置与训练指南

## 一、基础环境配置 (Windows 侧)

1. 安装 WSL2: 打开 PowerShell 执行 wsl --install。
2. 性能优化: 按 Win + R 输入 %UserProfile%，新建/编辑 .wslconfig 文件。建议配置如下：

[wsl2]
memory=32GB    # 建议为物理内存的 50%-75%
swap=32GB       # 建议与内存等大，防止导出模型时 OOM
processors=16 # 建议填入实际物理核心数

修改后需重启 WSL: wsl --shutdown

## 二、 WSL 内部环境安装

# 1. 运行官方安装脚本
chmod +x setup_linux_native.sh && ./setup_linux_native.sh
# 2. 激活 GPU 运行环境
source activate_gpu.sh
# 3. 补全必要依赖 (FFmpeg)
sudo apt update && sudo apt install ffmpeg -y
pip install ffmpeg-python

## 三、标准作业流程 (Workflow)
1. 素材预处理 (切脸)
根据显存调整并发数（16G 显存建议设置 2-3）：

python main.py extract \
--input-dir ~/workspace/data_dst \
--output-dir ~/workspace/data_dst/aligned/ \
--detector s3fd --jpeg-quality 100 --workers-per-gpu 2

2. 模型训练

python3 main.py train \
--training-data-src-dir $HOME/workspace/data_src \
--training-data-dst-dir $HOME/workspace/data_dst \
--model-dir $HOME/workspace/model --model SAEHD

3. 模型导出与合成 (Merge)

* 导出 DFM: python main.py exportdfm --model-dir ~/workspace/model --model SAEHD
* 执行合成:

python main.py merge \
--input-dir ~/workspace/data_dst \
--output-dir ~/workspace/data_dst/merged \
--output-mask-dir ~/workspace/data_dst/merged_mask \
--aligned-dir ~/workspace/data_dst/aligned \
--model-dir ~/workspace/model --model SAEHD

4. 导出成品视频

python main.py videoed video-from-sequence \
--input-dir ~/workspace/data_dst/merged \
--output-file ~/workspace/result.mp4 \
--reference-file ~/workspace/data_dst.* \
--include-audio

------------------------------
## 小贴士 (Tips)

* 自动补全依赖: 如果运行报错缺库，请统一执行 pip install -r requirements.txt。
* 路径检查: 命令中的 ~/workspace 为示例路径，请确保你的素材已放入对应文件夹。
* 性能调优: 训练时如果显存溢出（OOM），请在 train 命令中尝试调小 batch_size。

iyuandou · 发表于 2026-4-18 01:15:27

本帖最后由 iyuandou 于 2026-4-18 01:17 编辑

优化预览显示文件名与loss值
https://dfldata.cc/forum.php?mod=viewthread&tid=21350
(出处: deepfacelab中文网)
256分辨率：

512分辨率：

使用方法：解压，覆盖同名文件

预览文件名及Loss补丁.tar (91.5 KB, 下载次数: 18)

iyuandou · 发表于 2026-4-18 18:21:52

本帖最后由 iyuandou 于 2026-4-18 18:27 编辑

新增偏航筛选功能
##设计初衷：
1、解决SRC/DST同一偏航角度中大量重复脸图，影响训练效率
2、筛选出缺少的角度图片，方便补充
3、解决同人不同SRC的合并
## 核心功能
### 1. 按偏航角分组抽取
- 角度分组：将人脸按偏航角度（yaw）分为 128 个等分组
- 自定义抽取数量：用户可通过 --imgs-per-group 参数指定每组抽取的图片数量
- 源人脸匹配：对源人脸按相同分组抽取相同数量的图片
- 缺失组处理：检测源人脸缺失或数量不足的角度组，将对应组的目标人脸复制到"缺少角度"目录
### 2. 功能增强
- 俯仰角度分组：支持通过 --pitch-groups 参数设置俯仰角度的分组数量（1-20）
- 图像质量评估：使用拉普拉斯算子计算图像清晰度，优先选择高质量人脸
- 智能排序：可选择基于图像质量和角度的综合排序，或仅按角度排序
### 3. 性能优化
- 多进程并行处理：使用 FaceProcessorSubprocessor 类实现多进程并行处理，充分利用 CPU 核心
- GPU 加速：支持使用 TensorFlow GPU 加速图像质量评估，速度提升 3-10 倍
- 缓存机制：实现基于 JSON 文件的缓存系统，存储人脸角度和质量分数，避免重复计算，后续运行速度提升 10-100 倍，几乎瞬间完成
- 智能缓存管理：只处理未缓存的数据，已缓存的数据直接从缓存中读取
### 4. 目录结构说明
- 训练目标人脸：存放筛选出来的目标人脸图片
- 训练源人脸：存放筛选出来的源人脸图片
- 缺少角度：存放源人脸缺失或数量不足的角度组对应的目标人脸图片
- 原始文件保留：保留原始文件，只是将筛选出来的图片复制到新目录
## 使用方法
- 运行 python main.py sort --input-dir path/to/target/faces
- 选择 yaw group extraction 选项
- 输入源人脸目录（可选）
- 输入每组抽取的图片数量
- 输入俯仰角度分组数量
- 选择是否基于图像质量排序
- 选择是否使用 GPU 加速

新增偏航筛选功能.tar (86 KB, 下载次数: 13) 解压，覆盖同名文件

cptbtptp · 发表于 2026-4-28 08:35:17

taiyangbaobei 发表于 2026-4-24 14:22
200多块的所谓开源还有共享精神吗

200多块呢？不少了，我连20都觉得贵，大户人家的孩子确实豪横，也为你点赞

taiyangbaobei · 发表于 2026-4-24 14:22:47

cptbtptp 发表于 2026-4-24 14:08
在这个时代，还有共享精神的人，值得点赞点赞再点赞

200多块的所谓开源还有共享精神吗

iyuandou · 发表于 2026-4-17 00:29:00

本帖最后由 iyuandou 于 2026-4-17 14:59 编辑

遮罩训练正常：
启动命令：
python main.py train --training-data-src-dir ~/workspace/data_src/aligned --training-data-dst-dir ~/workspace/data_dst/aligned --model-dir ~/workspace/model --model XSeg

ulu · 发表于 2026-4-17 04:39:49

支持老铁

DFL小白02 · 发表于 2026-4-17 06:53:18

都修改了哪些文件，有清单吗？

july · 发表于 2026-4-17 07:32:24

开源免费
请问开源项目地址多少？

ajno22 · 发表于 2026-4-17 08:55:13

支持大佬~!

come3002 · 发表于 2026-4-17 09:37:36

感谢分享。马上下载

毕加索 · 发表于 2026-4-17 13:30:15

支持，祝你生日快乐，发大财~

iyuandou · 发表于 2026-4-17 15:03:26

july 发表于 2026-4-17 07:32
开源免费
请问开源项目地址多少？

压缩包里是源代码

iyuandou · 发表于 2026-4-17 15:17:54

毕加索发表于 2026-4-17 13:30
支持，祝你生日快乐，发大财~

谢谢

		自动登录	找回密码
密码			立即注册（仅限QQ邮箱）

DFL 原版焕新：完美适配 RTX 30-50 系，算力性能翻倍！

新增偏航筛选功能

万事如意节日勋章

开心娱乐节日勋章