deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 555|回复: 14

救命,我的显卡GPU在偷懒!!

[复制链接]

12

主题

58

帖子

6732

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6732
 楼主| 发表于 2024-12-7 01:47:38 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
之前说合成是CPU的事,那这次提取脸部是显卡GPU的问题了吧,但是明显这个显卡消极怠工啊,连一半力都没出50%使用率都没有!!显卡风扇都没转一下(温度50°才会转)

这是我显卡在偷懒吧,求求大神们这个怎么才能鞭打它全力输出啊!

QQ20241207-014230.jpg
回复

使用道具 举报

3

主题

209

帖子

4436

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4436
发表于 2024-12-7 02:25:26 | 显示全部楼层
本帖最后由 Terea 于 2024-12-7 02:35 编辑

80000张图,因为IO读取储存是CPU的事,只有侦测是GPU的事;
加上每张图片可能还侦测到不止一个人脸,那读取以及储存的量就更大了;
所以GPU跑不满呀...

有前辈分析过,你可以参考:
新版本0422版CPU提脸和GPU提脸速度效率测试-综合讨论-deepfacelab中文网 - Powered by Discuz!

020349f21ju5ehevdkwikd.png


回复 支持 反对

使用道具 举报

14

主题

3357

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
17960

真我风采勋章万事如意节日勋章

发表于 2024-12-7 02:48:26 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-12-7 02:49 编辑

上贴说了,GPU是装模型的。
S3FD人脸识别也是模型,所以,你又想多了。。。
回复 支持 反对

使用道具 举报

3

主题

209

帖子

4436

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4436
发表于 2024-12-7 02:57:51 | 显示全部楼层
wtxx8888 发表于 2024-12-7 02:48
上贴说了,GPU是装模型的。
S3FD人脸识别也是模型,所以,你又想多了。。。
...

不是我想的那样啊?
回复 支持 反对

使用道具 举报

23

主题

542

帖子

3339

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3339

万事如意节日勋章

发表于 2024-12-7 06:50:58 | 显示全部楼层
wtxx8888 发表于 2024-12-7 02:48
上贴说了,GPU是装模型的。
S3FD人脸识别也是模型,所以,你又想多了。。。
...

多加几条线程就能跑满了吧,因为显存占用不是很多
回复 支持 反对

使用道具 举报

12

主题

58

帖子

6732

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6732
 楼主| 发表于 2024-12-7 11:31:22 | 显示全部楼层
Terea 发表于 2024-12-7 02:25
80000张图,因为IO读取储存是CPU的事,只有侦测是GPU的事;
加上每张图片可能还侦测到不止一个人脸,那读取 ...

但是我的CPU使用率也不高啊。。不到20%。。感觉这2货都在消极怠工啊。
回复 支持 反对

使用道具 举报

14

主题

3357

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
17960

真我风采勋章万事如意节日勋章

发表于 2024-12-7 12:55:39 | 显示全部楼层
99707728 发表于 2024-12-7 11:31
但是我的CPU使用率也不高啊。。不到20%。。感觉这2货都在消极怠工啊。

单线程工作,有想法的话。
记得坛子里,有改代码变成多线程的,或者用快切。

个人反正,是不用快切的,就原版切脸,显存小,也用不到多线程。
回复 支持 反对

使用道具 举报

7

主题

119

帖子

7723

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7723
发表于 2024-12-7 14:33:07 | 显示全部楼层
wtxx8888 发表于 2024-12-7 12:55
单线程工作,有想法的话。
记得坛子里,有改代码变成多线程的,或者用快切。

楼主说的切脸gpu没跑满,我自己的观点,cpu计算的时候,gpu有闲置时间,我自己改过代码,gpu循环取队列,cpu放入队列,多对一的形式,gpu利用率比较稳定,切脸效率有一定提升,但整体没有减少太多时间,这块有提升效率想法最终也作用不大。

我自己有个偷懒的方式,视频提取帧图片,帧数减半,处理时间一下就少了。最终合成ffmpeg再升一下帧数,这是我的方式。
回复 支持 反对

使用道具 举报

14

主题

3357

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
17960

真我风采勋章万事如意节日勋章

发表于 2024-12-7 14:48:08 | 显示全部楼层
z_charles 发表于 2024-12-7 14:33
楼主说的切脸gpu没跑满,我自己的观点,cpu计算的时候,gpu有闲置时间,我自己改过代码,gpu循环取队列, ...

多对一,肯定提升不大,GPU还是单线的。
GPU也要多线程,才会大幅度提升速度,只是显存的耗量,要成倍的增加。
GPU一般是4线程的。
回复 支持 反对

使用道具 举报

7

主题

119

帖子

7723

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
7723
发表于 2024-12-7 17:19:00 | 显示全部楼层
wtxx8888 发表于 2024-12-7 14:48
多对一,肯定提升不大,GPU还是单线的。
GPU也要多线程,才会大幅度提升速度,只是显存的耗量,要成倍的 ...

感谢大佬的指导,和提供思路,论坛有你这样的热心人真好。
我当时代码进行了分离,cpu相关的都提出来,gpu只计算它那几句,结果存到队列,然后下一次循环,虽然没用多线程效率应该可以。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-3-14 03:09 , Processed in 0.130019 second(s), 37 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表