deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 2750|回复: 30

训练时发现有一部分显存被占用

[复制链接]

3

主题

18

帖子

123

积分

高级丹童

Rank: 2

积分
123
发表于 2021-1-4 02:41:34 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
2021-01-04 02:01:15.587321: E tensorflow/stream_executor/cuda/cuda_driver.cc:806] failed to allocate 2.13G (2287871488 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY: out of memory
请问如何知道2.13G的显存被谁占用了?如何去释放这部分显存?我的电脑现在除了dfl别的都已经关掉了
回复

使用道具 举报

2

主题

72

帖子

625

积分

高级丹师

Rank: 5Rank: 5

积分
625
发表于 2021-1-4 03:28:01 | 显示全部楼层
你这个是显存已经爆了,不是2.13G显存不能用,只是单纯的你的显卡不够罢了。你需要降低训练参数比如BS,在WIN10环境下,系统本身以及显存自身的缓冲区的原因,显存不可能百分百释放给你,你可考虑使用linux环境,但实际提升的也不多。
回复 支持 反对

使用道具 举报

78

主题

1523

帖子

7893

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7893

万事如意节日勋章

发表于 2021-1-4 08:06:33 | 显示全部楼层
改成win7可以提升。以前看过这方面速度对比
回复 支持 反对

使用道具 举报

11

主题

562

帖子

3720

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3720
发表于 2021-1-4 12:42:13 | 显示全部楼层
降低数值是最好的解决办法。
回复 支持 反对

使用道具 举报

3

主题

402

帖子

2476

积分

初级丹圣

Rank: 8Rank: 8

积分
2476
发表于 2021-1-6 12:43:02 | 显示全部楼层
hsTony 发表于 2021-1-4 03:28
你这个是显存已经爆了,不是2.13G显存不能用,只是单纯的你的显卡不够罢了。你需要降低训练参数比如BS,在W ...

非常详细
回复 支持 反对

使用道具 举报

0

主题

401

帖子

2019

积分

禁止访问

积分
2019
发表于 2021-1-15 19:27:47 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

33

主题

989

帖子

7296

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7296

万事如意节日勋章

发表于 2021-3-5 15:58:38 | 显示全部楼层
闲逛路过,水丹
回复 支持 反对

使用道具 举报

3

主题

422

帖子

2272

积分

初级丹圣

Rank: 8Rank: 8

积分
2272
发表于 2021-3-28 18:48:33 | 显示全部楼层
真的不错
回复

使用道具 举报

发表于 2021-3-29 10:50:12 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4

主题

198

帖子

2843

积分

初级丹圣

Rank: 8Rank: 8

积分
2843
发表于 2021-3-29 15:25:53 | 显示全部楼层
路过支持一个
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-9-30 07:15 , Processed in 0.094103 second(s), 9 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表