deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 538|回复: 5

萌新一枚 求大佬解惑 我训练模型时跑四五个小时就卡死

[复制链接]

3

主题

19

帖子

324

积分

初级丹师

Rank: 3Rank: 3

积分
324
 楼主| 发表于 2024-5-27 07:22:25 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
每次都是这样   跑个四五小时就卡死  预览界面刷新保存没反应






这个也不动了

image.png

image.png
回复

使用道具 举报

3

主题

50

帖子

841

积分

高级丹师

Rank: 5Rank: 5

积分
841
发表于 2024-5-27 09:09:19 | 显示全部楼层
单次迭代时间越来越长,分配给DFL的算力越来越少,我觉得,检查你的风扇,散热什么的,或者是你还在同时跑其它的软件。
回复 支持 1 反对 0

使用道具 举报

40

主题

796

帖子

4374

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4374

万事如意节日勋章

发表于 2024-5-27 07:34:40 | 显示全部楼层
什么卡   是不是鼠标点了cmd窗口暂停了
回复 支持 反对

使用道具 举报

9

主题

188

帖子

3610

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3610
QQ
发表于 2024-5-27 07:56:30 | 显示全部楼层
我之前也遇到过卡死的情况,不过一般是刚开始跑的几分钟之内出现,把batch size调小之后就好了
回复 支持 反对

使用道具 举报

3

主题

19

帖子

324

积分

初级丹师

Rank: 3Rank: 3

积分
324
 楼主| 发表于 2024-5-27 21:53:05 | 显示全部楼层
yxyao 发表于 2024-5-27 07:56
我之前也遇到过卡死的情况,不过一般是刚开始跑的几分钟之内出现,把batch size调小之后就好了 ...

都调到4了   越跑越慢   一慢就卡死
回复 支持 反对

使用道具 举报

3

主题

19

帖子

324

积分

初级丹师

Rank: 3Rank: 3

积分
324
 楼主| 发表于 2024-5-27 21:58:27 | 显示全部楼层
avtopalang 发表于 2024-5-27 09:09
单次迭代时间越来越长,分配给DFL的算力越来越少,我觉得,检查你的风扇,散热什么的,或者是你还在同时跑 ...

单次迭代越来越长   跑的越来越慢  慢了就容易卡死      但是GPU利用率越来越少上不去
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-10-18 12:08 , Processed in 0.083494 second(s), 11 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表