deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 189|回复: 4

Deepfacelab_Linux版本报错,请问一下如何解决

[复制链接]

1

主题

9

帖子

119

积分

高级丹童

Rank: 2

积分
119
 楼主| 发表于 2024-10-18 19:10:04 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评

MVE分支版本。
tensorflow 2.7.4
cuDNN 8.1


不挂预训练模型就没事,可以训练,预览窗口都正常
model文件夹中有预训练模型就会报错,无法训练
有没有知道的大佬指点一下,感谢

  1. Starting. Press "Enter" to stop training and save model.
  2. Error: 3 root error(s) found.
  3.   (0) FAILED_PRECONDITION: Attempting to use uninitialized value src_dst_opt/ms_decoder_dst/out_conv2/weight_0
  4.          [[node src_dst_opt/ms_decoder_dst/out_conv2/weight_0/read
  5. (defined at /home/aaa/dev/DeepFaceLab_Linux/DeepFaceLab/core/leras/optimizers/AdaBelief.py:37)
  6. ]]
  7.          [[decoder_src/upscale0/conv1/weight/read/_669]]
  8.   (1) FAILED_PRECONDITION: Attempting to use uninitialized value src_dst_opt/ms_decoder_dst/out_conv2/weight_0
  9.          [[node src_dst_opt/ms_decoder_dst/out_conv2/weight_0/read
  10. (defined at /home/aaa/dev/DeepFaceLab_Linux/DeepFaceLab/core/leras/optimizers/AdaBelief.py:37)
  11. ]]
  12.          [[concat_15/_1111]]
  13.   (2) FAILED_PRECONDITION: Attempting to use uninitialized value src_dst_opt/ms_decoder_dst/out_conv2/weight_0
  14.          [[node src_dst_opt/ms_decoder_dst/out_conv2/weight_0/read
  15. (defined at /home/aaa/dev/DeepFaceLab_Linux/DeepFaceLab/core/leras/optimizers/AdaBelief.py:37)
  16. ]]
复制代码
后面的错误代码是多线程的错误,不是主要原因就不放上来了。
关键报错代码是:
  1. File "/home/aaa/dev/DeepFaceLab_Linux/DeepFaceLab/core/leras/optimizers/AdaBelief.py", line 37, in initialize_variables
  2. >>>     ms = { v.name : tf.get_variable ( f'ms_{v.name}'.replace(':','_'), v.shape, dtype=v.dtype, initializer=tf.initializers.constant(0.0), trainable=False) for v in trainable_weights }
  3. >>>
  4. >>>   File "/home/aaa/dev/DeepFaceLab_Linux/DeepFaceLab/core/leras/optimizers/AdaBelief.py", line 37, in <dictcomp>
  5. >>>     ms = { v.name : tf.get_variable ( f'ms_{v.name}'.replace(':','_'), v.shape, dtype=v.dtype, initializer=tf.initializers.constant(0.0), trainable=False) for v in trainable_weights }
复制代码


回复

使用道具 举报

14

主题

2985

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
16186

真我风采勋章万事如意节日勋章

发表于 2024-10-18 19:38:36 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-10-18 19:54 编辑

这个错误信息表明,在尝试使用未初始化的变量 src_dst_opt/ms_decoder_dst/out_conv2/weight_0 时遇到了问题。
这通常发生在,模型训练开始之前,模型的某些参数,没有被正确初始化。

要解决这个问题,可以尝试以下几个步骤:

‌检查模型初始化代码‌:
确保所有的模型参数,在使用前,都已经被正确初始化。
在深度学习框架中,通常需要显式地初始化模型参数,比如使用 tf.global_variables_initializer() 或类似的函数。

‌检查自定义优化器‌:
错误信息中提到了 AdaBelief.py,这是一个自定义的AB优化器。
确保这个优化器,正确地实现了所有必要的功能,并且在训练开始前,正确地初始化了所有变量。

‌检查模型定义‌:
有时候模型定义中的某些层,可能没有正确地设置,导致参数初始化失败。
检查模型的每一层,确保它们都配置正确。

你提到了,不挂模型就是正常的。
估计这个模型,跟你软件的版本,是不匹配的。
回复 支持 反对

使用道具 举报

1

主题

17

帖子

778

积分

高级丹师

Rank: 5Rank: 5

积分
778

万事如意节日勋章

发表于 2024-10-18 19:53:41 | 显示全部楼层
我有次把npy文件名改了,也报这个错误,
回复 支持 反对

使用道具 举报

1

主题

9

帖子

119

积分

高级丹童

Rank: 2

积分
119
 楼主| 发表于 2024-10-21 15:57:19 | 显示全部楼层
wtxx8888 发表于 2024-10-18 19:38
这个错误信息表明,在尝试使用未初始化的变量 src_dst_opt/ms_decoder_dst/out_conv2/weight_0 时遇到了问 ...

模型是从论坛上找的一个。在window上的DFL是能跑的,非常奇怪
回复 支持 反对

使用道具 举报

1

主题

9

帖子

119

积分

高级丹童

Rank: 2

积分
119
 楼主| 发表于 2024-10-21 15:58:52 | 显示全部楼层
上弦月 发表于 2024-10-18 19:53
我有次把npy文件名改了,也报这个错误,

好吧,我倒是没有改过npy文件名
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-12-4 01:19 , Processed in 0.125362 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表