deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
12
返回列表 发新帖
楼主: WaveBedo

训练一段时间之后,数据不动了,是什么原因?

[复制链接]

35

主题

501

帖子

2916

积分

初级丹圣

Rank: 8Rank: 8

积分
2916

万事如意节日勋章

发表于 2024-3-7 19:42:56 | 显示全部楼层
重新安装客户端试试,注意备份workspace
回复 支持 反对

使用道具 举报

32

主题

633

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2024-3-7 20:03:36 | 显示全部楼层
pasanonic 发表于 2024-3-7 19:42
重新安装客户端试试,注意备份workspace

应该跟安装无关,RG、ME两个版本,出现同样的问题
可能是显卡的问题,也可能是我电脑的问题

也怀疑是不是迭代10万之后,模型数据太大了,我的电脑应付不了了
就像水满了,再加,加不了了
回复 支持 反对

使用道具 举报

35

主题

501

帖子

2916

积分

初级丹圣

Rank: 8Rank: 8

积分
2916

万事如意节日勋章

发表于 2024-3-7 20:17:29 | 显示全部楼层
本帖最后由 pasanonic 于 2024-3-7 20:20 编辑
WaveBedo 发表于 2024-3-7 20:03
应该跟安装无关,RG、ME两个版本,出现同样的问题
可能是显卡的问题,也可能是我电脑的问题

能稳定运行10万,硬件应该不会有问题,肯定是软件因素
这要排查    看看驱动是不是后台自动更新了,最近有没有装什么软件,换个实验模型试试,或者只开扭曲,其他都关掉跑
回复 支持 反对

使用道具 举报

32

主题

633

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2024-3-8 18:37:19 | 显示全部楼层
lknet 发表于 2024-3-7 19:32
不用一个硬盘
你可以建个新的低参数模型跑跑试试,能跑大概率显存问题

搞清楚了,应该是没开梯度裁剪的原因
打开梯度裁剪之后,可以继续跑了
回复 支持 反对

使用道具 举报

32

主题

633

帖子

4050

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4050

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2024-3-8 18:38:50 | 显示全部楼层
pasanonic 发表于 2024-3-7 20:17
能稳定运行10万,硬件应该不会有问题,肯定是软件因素
这要排查    看看驱动是不是后台自动更新了,最近有没 ...

搞清楚了,应该是没开梯度裁剪的原因
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-5-18 14:16 , Processed in 0.090939 second(s), 9 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表