deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: iyuandou

炼丹省电保护显卡之我见

[复制链接]

5

主题

241

帖子

5559

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5559

万事如意节日勋章

QQ
发表于 2023-9-13 09:38:19 | 显示全部楼层
本帖最后由 Mrdeepfake 于 2023-9-13 10:06 编辑
iyuandou 发表于 2023-9-13 09:16
大佬,这个电力监测仪是硬件,硬件,硬件,很硬的那种,可以砸核桃,还不准确呀?

你家装几个电表?哈哈 ...

嗯,我修改回复内容时,还没看到你更新的电表图。不考虑热效应等省电途径,按照迭代时间来算,你降频后,耗电功率应该是382W*419/450=356W, 但你实测耗电功率是315W,那么省电356W-315W=41W. 省电幅度大概10%,与此同时,你训练效率牺牲1-419/450=6.9%. 以牺牲近7%的训练效率换取10%的省电量,你自己还有其他人考虑考虑,看看值不值......看个人怎么选了。

若假定电阻率随温度呈线性关系,并且它们成正比,那么显卡降频前后温度分别为80、70摄氏度,转化为国际单位开尔文(K),降频前后温度分别为 353K、 343K,由电阻率变化造成的节电效率应该是1-343/353=2.8%. 看来主要省电途径来源于其他机制了,比如温度变化造成的半导体性能变化,配合降频带来的容抗和感抗的虚部变化等......纯属好玩估算了一下
回复 支持 反对

使用道具 举报

0

主题

28

帖子

955

积分

高级丹师

Rank: 5Rank: 5

积分
955
发表于 2023-9-13 09:50:23 | 显示全部楼层
多谢,温度降下来了,原来80度,现在65度。
回复 支持 反对

使用道具 举报

17

主题

144

帖子

2371

积分

初级丹圣

Rank: 8Rank: 8

积分
2371
 楼主| 发表于 2023-9-13 09:54:22 | 显示全部楼层
Mrdeepfake 发表于 2023-9-13 09:38
嗯,我修改回复内容时,还没看到你更新的电表图。不考虑热效应等省电途径,按照迭代时间来算,你降频后, ...

主要还是保护显卡,没锁时,那显卡风扇呼拉拉的,锁完后,整个世界清静了。
也没你算的那么大的牺牲,把功耗锁了,再把GPU频率恢复到原来的1700MHz后,迭代时间,相差无已
回复 支持 反对

使用道具 举报

11

主题

94

帖子

2731

积分

初级丹圣

Rank: 8Rank: 8

积分
2731
发表于 2023-9-13 11:02:49 | 显示全部楼层
测试了一下,是不是可能更加适用于满载跑的情况。同3080显卡(火神),在使用率 65左右时,降低1000频率,功率由100锁到90,实际功耗并没有减少,温度下降1-2度(65-61)之间浮动,功耗基本维持234左右没有变动。可能因为本身就没有跑满?
回复 支持 反对

使用道具 举报

8

主题

139

帖子

3995

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3995
发表于 2023-9-13 11:35:21 | 显示全部楼层
不错的思路,收藏了。
回复 支持 反对

使用道具 举报

17

主题

144

帖子

2371

积分

初级丹圣

Rank: 8Rank: 8

积分
2371
 楼主| 发表于 2023-9-13 12:05:45 | 显示全部楼层
594938857 发表于 2023-9-13 11:02
测试了一下,是不是可能更加适用于满载跑的情况。同3080显卡(火神),在使用率 65左右时,降低1000频率, ...

管用就好,原理靠猜,我也不是技术流
回复 支持 反对

使用道具 举报

17

主题

144

帖子

2371

积分

初级丹圣

Rank: 8Rank: 8

积分
2371
 楼主| 发表于 2023-9-13 12:06:50 | 显示全部楼层
Mrdeepfake 发表于 2023-9-13 09:38
嗯,我修改回复内容时,还没看到你更新的电表图。不考虑热效应等省电途径,按照迭代时间来算,你降频后, ...

你是学电工的吗?
回复 支持 反对

使用道具 举报

13

主题

527

帖子

3792

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3792
发表于 2023-9-13 12:16:52 | 显示全部楼层
Mrdeepfake 发表于 2023-9-13 09:38
嗯,我修改回复内容时,还没看到你更新的电表图。不考虑热效应等省电途径,按照迭代时间来算,你降频后, ...

好奇怪,LZ的功率是恒定的?

我用电表测的时候,功率是一直变化的,
变化还挺大,所以我只能大概估个数字。。。
回复 支持 反对

使用道具 举报

5

主题

241

帖子

5559

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5559

万事如意节日勋章

QQ
发表于 2023-9-13 12:46:04 | 显示全部楼层
本帖最后由 Mrdeepfake 于 2023-9-13 12:51 编辑
iyuandou 发表于 2023-9-13 12:06
你是学电工的吗?

不,学过物理学,包括力、热、光、电,做过凝聚态物理研究,对半导体原理、性质等了解一些,懂一些基本原理和计算。
回复 支持 反对

使用道具 举报

16

主题

80

帖子

3024

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3024

万事如意节日勋章开心娱乐节日勋章

发表于 2023-9-13 12:50:57 | 显示全部楼层
其实就是降压超频吧我之前也折腾过一次,参数没调好训练总出问题,还来论坛问了,后来调好之后确实好用,温度能降大十几度
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-24 03:32 , Processed in 0.153743 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表