deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 764|回复: 6

训练模型时出现的报错Unexpected Event status

[复制链接]

18

主题

110

帖子

2521

积分

初级丹圣

Rank: 8Rank: 8

积分
2521

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2022-8-18 15:49:09 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
大佬们好,
小的刚换新显卡,
用新显卡第一次练模型,
跑了几个小时之后出现以下报错:
2022-08-18_131022.jpg

2022-08-18 09:12:15.162803: Ftensorflow/core/common_runtime/device/device_event_mgr.cc:221] Unexpected Eventstatus: 1
  
模型训练报错完就自己停止了。
这种状况我以前没遇到过,
请问有高手了解这是哪方面的原因吗?

回复

使用道具 举报

17

主题

291

帖子

3061

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3061
发表于 2022-8-18 17:46:20 | 显示全部楼层
刚刚有去查了类似情况,有個答案是因为显卡过热
回复 支持 反对

使用道具 举报

18

主题

110

帖子

2521

积分

初级丹圣

Rank: 8Rank: 8

积分
2521

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2022-8-19 02:04:55 | 显示全部楼层
Hulio666 发表于 2022-8-18 17:46
刚刚有去查了类似情况,有個答案是因为显卡过热

呀,感谢解惑了!
以前旧显卡效能较低,放着跑整晚没问题,
现在新显卡效能好,竟然几小时就过热,我晕
回复 支持 反对

使用道具 举报

39

主题

1492

帖子

8227

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8227

万事如意节日勋章

发表于 2022-8-19 08:33:03 | 显示全部楼层
把能开的奥拓换个奥迪发动机可能连开都开不了了
回复 支持 反对

使用道具 举报

0

主题

6

帖子

81

积分

高级丹童

Rank: 2

积分
81
发表于 2022-9-24 15:33:18 | 显示全部楼层
我的不是温度的问题,单显卡正常,开多卡就报错了,楼主找到原因了吗?
回复 支持 反对

使用道具 举报

18

主题

110

帖子

2521

积分

初级丹圣

Rank: 8Rank: 8

积分
2521

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2022-9-25 23:25:35 | 显示全部楼层
dsk123 发表于 2022-9-24 15:33
我的不是温度的问题,单显卡正常,开多卡就报错了,楼主找到原因了吗?

原因不明,只能推测可能如同之前大佬回复,
是温度过高导致的问题
回复 支持 反对

使用道具 举报

41

主题

741

帖子

5297

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5297

万事如意节日勋章开心娱乐节日勋章

发表于 2024-3-6 16:13:07 | 显示全部楼层
搜索了一圈,有不少人都遇到这个问题。但似乎都没有确切的回复
我跑了10个小时,也遇到这个问题了
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-26 01:42 , Processed in 0.178035 second(s), 37 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表