deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 966|回复: 9

训练报错求解,到底是哪出问题了呀

[复制链接]

11

主题

209

帖子

1764

积分

初级丹圣

Rank: 8Rank: 8

积分
1764
 楼主| 发表于 2023-2-26 02:09:15 | 显示全部楼层 |阅读模式
Welcome to bitsandbytes. For bug reports, please submit your error trace to: https://github.com/TimDettmers/bitsandbytes/issues
For effortless bug reporting copy-paste your error into this form: https://docs.google.com/forms/d/ ... iewform?usp=sf_link
================================================================================
CUDA SETUP: Loading binary H:\deepfacelab\绘画ai\lora训练\lora-scripts\venv\lib\site-packages\bitsandbytes\libbitsandbytes_cuda116.dll...
use 8-bit AdamW optimizer | {}
override steps. steps for 20 epochs is / 指定エポックまでのステップ数: 600
running training / 学習開始
  num train images * repeats / 学習画像の数×繰り返し回数: 30
  num reg images / 正則化画像の数: 0
  num batches per epoch / 1epochのバッチ数: 30
  num epochs / epoch数: 20
  batch size per device / バッチサイズ: 1
  total train batch size (with parallel & distributed & accumulation) / 総バッチサイズ(並列学習、勾配合計含む): 1
  gradient accumulation steps / 勾配を合計するステップ数 = 1
  total optimization steps / 学習ステップ数: 600
steps:   0%|                                                                                   | 0/600 [00:00<?, ?it/s]epoch 1/20
Error no kernel image is available for execution on the device at line 167 in file D:\ai\tool\bitsandbytes\csrc\ops.cu
Traceback (most recent call last):
  File "C:\Users\Mloong\AppData\Local\Programs\Python\Python310\lib\runpy.py", line 196, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "C:\Users\Mloong\AppData\Local\Programs\Python\Python310\lib\runpy.py", line 86, in _run_code
    exec(code, run_globals)
  File "H:\deepfacelab\绘画ai\lora训练\lora-scripts\venv\Scripts\accelerate.exe\__main__.py", line 7, in <module>
  File "H:\deepfacelab\绘画ai\lora训练\lora-scripts\venv\lib\site-packages\accelerate\commands\accelerate_cli.py", line 45, in main
    args.func(args)
  File "H:\deepfacelab\绘画ai\lora训练\lora-scripts\venv\lib\site-packages\accelerate\commands\launch.py", line 1104, in launch_command
    simple_launcher(args)
  File "H:\deepfacelab\绘画ai\lora训练\lora-scripts\venv\lib\site-packages\accelerate\commands\launch.py", line 567, in simple_launcher
    raise subprocess.CalledProcessError(returncode=process.returncode, cmd=cmd)
subprocess.CalledProcessError: Command '['H:\\deepfacelab\\绘画ai\\lora训练\\lora-scripts\\venv\\Scripts\\python.exe', './sd-scripts/train_network.py', '--enable_bucket', '--pretrained_model_name_or_path=./sd-models/model.safetensors', '--train_data_dir=./train/xiaoen', '--output_dir=./output', '--logging_dir=./logs', '--resolution=512,640', '--network_module=networks.lora', '--max_train_epochs=20', '--learning_rate=1e-4', '--unet_lr=1e-4', '--text_encoder_lr=1e-5', '--lr_scheduler=cosine_with_restarts', '--lr_warmup_steps=0', '--network_dim=32', '--network_alpha=32', '--output_name=xiaoen', '--train_batch_size=1', '--save_every_n_epochs=2', '--mixed_precision=fp16', '--save_precision=fp16', '--seed=1337', '--cache_latents', '--clip_skip=2', '--prior_loss_weight=1', '--max_token_length=225', '--caption_extension=.txt', '--save_model_as=safetensors', '--min_bucket_reso=256', '--max_bucket_reso=1024', '--xformers', '--shuffle_caption', '--use_8bit_adam']' returned non-zero exit status 1.
Train finished

回复

使用道具 举报

5

主题

189

帖子

2334

积分

版主

Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30

积分
2334

见习版主勋章优质版主勋章

发表于 2023-2-26 17:05:23 | 显示全部楼层
k16576 发表于 2023-2-26 17:03
应该可以吧,看的教程上也是有中文的,我也不知道

你加群贴一下错误图吧
AI绘画讨论交流QQ群748167404
回复 支持 1 反对 0

使用道具 举报

11

主题

209

帖子

1764

积分

初级丹圣

Rank: 8Rank: 8

积分
1764
 楼主| 发表于 2023-2-26 02:44:54 | 显示全部楼层
我也调了虚拟内存为托管的系统,还是报错
回复 支持 反对

使用道具 举报

1

主题

15

帖子

518

积分

高级丹师

Rank: 5Rank: 5

积分
518

万事如意节日勋章

发表于 2023-2-26 02:52:17 | 显示全部楼层
是10系显卡吗,试一下删掉train.ps1里面的--use_8bit_adam
回复 支持 反对

使用道具 举报

11

主题

209

帖子

1764

积分

初级丹圣

Rank: 8Rank: 8

积分
1764
 楼主| 发表于 2023-2-26 03:05:09 | 显示全部楼层
z10ym 发表于 2023-2-26 02:52
是10系显卡吗,试一下删掉train.ps1里面的--use_8bit_adam

删掉了的,也是不行。。
回复 支持 反对

使用道具 举报

6

主题

838

帖子

5281

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5281

万事如意节日勋章

发表于 2023-2-26 08:31:15 | 显示全部楼层
k16576 发表于 2023-2-26 03:05
删掉了的,也是不行。。

强制更新后有个参数1改为0,就是这个use_8bit_adam的问题
回复 支持 反对

使用道具 举报

8

主题

137

帖子

2688

积分

初级丹圣

Rank: 8Rank: 8

积分
2688

荣誉会员勋章小有贡献勋章

发表于 2023-2-26 08:50:46 | 显示全部楼层
中文路径是可以的吗?
回复 支持 反对

使用道具 举报

5

主题

189

帖子

2334

积分

版主

Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30

积分
2334

见习版主勋章优质版主勋章

发表于 2023-2-26 15:44:12 | 显示全部楼层
你是使用的最新的脚本吗
AI绘画讨论交流QQ群748167404
回复 支持 反对

使用道具 举报

11

主题

209

帖子

1764

积分

初级丹圣

Rank: 8Rank: 8

积分
1764
 楼主| 发表于 2023-2-26 17:01:29 | 显示全部楼层
抹茶味牛子 发表于 2023-2-26 15:44
你是使用的最新的脚本吗

下的秋叶大佬的lora训练包
回复 支持 反对

使用道具 举报

11

主题

209

帖子

1764

积分

初级丹圣

Rank: 8Rank: 8

积分
1764
 楼主| 发表于 2023-2-26 17:03:33 | 显示全部楼层
vancheap 发表于 2023-2-26 08:50
中文路径是可以的吗?

应该可以吧,看的教程上也是有中文的,我也不知道
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-5-21 00:13 , Processed in 0.109440 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表