deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 328|回复: 4

新手小白练丹报错求大佬看一下哪里的问题

[复制链接]

8

主题

37

帖子

470

积分

初级丹师

Rank: 3Rank: 3

积分
470
 楼主| 发表于 2025-6-16 19:20:26 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
求大佬
%JS%@75M_7U6{}CTIGZM8U.png
5@Q@$225~75@$25~{K1@RK.png
回复

使用道具 举报

0

主题

7

帖子

123

积分

高级丹童

Rank: 2

积分
123
发表于 2025-6-16 23:16:53 | 显示全部楼层
deepseek一下,有大神来看看deep seek说的有多少可信度么?
从你提供的错误日志来看,DeepFaceLab 在训练过程中遇到了 资源耗尽(OOM, Out Of Memory) 和 CPU 相关计算错误,可能与显存不足或配置不当有关。以下是详细分析和解决方案:

1. 主要错误类型
(1) Resource exhausted(显存/内存不足)
关键报错:

plaintext
Resource exhausted: SameWorkerRecvDone unable to allocate output tensor...
原因:

GPU/CPU 内存不足,无法分配张量(常见于显存较小的显卡,如 RTX 3060 笔记本版仅 5.36GB 显存)。

可能因 batch_size 过大或模型复杂度高(如高分辨率 WF 模型)导致。

(2) CPU 计算错误
关键报错:

plaintext
File "E:\dan\RTX\DFLmaozhihanhuaRTX3000\__internal\DeepFacelab\core\leras\optimizers\AdaBelief.py", line 45...
原因:

某些操作被错误分配到 CPU 而非 GPU(如 lr_dropout 相关计算)。

可能是 TensorFlow 版本兼容性问题或配置错误。

2. 解决方案
(1) 显存不足问题
降低 batch_size:
修改 train.ini 或启动命令中的 batch_size(如从 12 降至 8 或更低)。

对于 RTX 3060 笔记本版,建议 batch_size=4~8(取决于模型类型)。

启用显存优化:
在 train.ini 中设置:

ini
allow_growth = True
或通过命令行添加 --allow-growth。

降低模型分辨率:
如果使用高分辨率模型(如 512),尝试切换到 256 或 320。

(2) CPU 计算错误
强制使用 GPU:
确保 TensorFlow 正确识别 GPU:

python
import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))  # 检查 GPU 是否可用
如果输出为空,需重新安装 GPU 版 TensorFlow(如 tensorflow-gpu==2.4.0)。

禁用 CPU 回退:
在代码中显式指定 GPU 设备:

python
with tf.device('/GPU:0'):
    # 训练代码
(3) 其他优化
关闭后台程序:
释放内存/显存占用(如浏览器、游戏等)。

更新驱动和库:
确保 CUDA、cuDNN 版本与 TensorFlow 兼容(如 TF 2.4.0 需 CUDA 11.0)。

检查数据路径:
确保路径无中文或特殊字符(如 E:\dan\RTX\... 可能是问题来源)。

3. 验证步骤
测试显存占用:
运行 nvidia-smi 监控显存使用情况,确认是否接近 5.36GB 上限。

简化测试:
用更低分辨率或少量数据测试,排除数据问题。

日志分析:
检查 DeepFaceLab 日志中是否有其他警告(如 CUDA 错误)。

总结
核心问题: RTX 3060 笔记本显存较小,batch_size 或模型设置过高导致 OOM。

优先尝试:

降低 batch_size → 4

设置 allow_growth = True

确保 TensorFlow 使用 GPU 而非 CPU。

如果问题仍存在,建议提供完整的训练配置(如模型类型、分辨率)以进一步诊断。

回复 支持 反对

使用道具 举报

8

主题

37

帖子

470

积分

初级丹师

Rank: 3Rank: 3

积分
470
 楼主| 发表于 2025-6-17 11:13:29 | 显示全部楼层
Lfly09 发表于 2025-6-16 23:16
deepseek一下,有大神来看看deep seek说的有多少可信度么?
从你提供的错误日志来看,DeepFaceLab 在训练过 ...

感谢大佬
回复 支持 反对

使用道具 举报

10

主题

130

帖子

8537

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8537
发表于 2025-6-17 14:48:24 | 显示全部楼层
你发在这个区就是错误
回复 支持 反对

使用道具 举报

8

主题

37

帖子

470

积分

初级丹师

Rank: 3Rank: 3

积分
470
 楼主| 发表于 2025-6-20 16:03:06 | 显示全部楼层
茶伊洢 发表于 2025-6-17 14:48
你发在这个区就是错误

发出去了发哪个区回复的多一点
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-7-2 15:14 , Processed in 0.114421 second(s), 35 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表