deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 2961|回复: 14

40系显卡求助4090+使用分享

[复制链接]

2

主题

32

帖子

543

积分

高级丹师

Rank: 5Rank: 5

积分
543
 楼主| 发表于 2022-12-30 10:47:21 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 asd96533 于 2022-12-31 13:58 编辑

换4090显卡后

以ZIBI6.0神丹为例,
如果我用DirectX12版本,训练过一段时间就可能突然停住,显卡功率直接掉到10几w,感觉就直接挂掉了,运气好过个1分钟可以突然又恢复训练,运气不好就一直挂掉。
如果用1120版本的RTX3000(N卡30系版本),那么会一直报错numpy.core.multiarray failed to import(原版和汉化版都一样),改了虚拟内存也不好使。
如果用老版本的RTX3000(N卡30系版本),可以正常训练,但是训练的曲线很奇怪,波动很大,比如图片里,前半段是Direct版本的曲线,后半段是老版30系版本的曲线。
用N卡30系版本功率有时候能跑满,有时候会锁在130W左右
image.png

求助各位大神
1、为什么Direct版本会突然停住
2、为啥1120版RTX3000一直报错打不开但老版RTX3000就可以
3、老版30系这个波动特别大的训练有没有问题啊,能就这么凑合用吗,会炼坏吗
4、用N卡30系版本功率有时候能跑满,有时候会锁在130W左右

.net升级了4.8.1,显卡驱动527.56

部分问题解决:
1、未解决,知道的大佬可以回复一下。
2、试了很多方法,出来很多其他乱七八糟的报错,最终解决办法--下git上官方的最新版,然后把虚拟内存加到300G以上,我在实际使用中虚拟内存大概用了180-200G左右,不知道为什么1120的N卡30版本需要这么大虚拟内存。老版顶天也就用几十G,有懂得大佬可以说下。
3、新版的波动恢复正常,建议不要用老版。
4、未解决

使用分享:
1、训练不建议用DirectX12版本,但切脸和合成DirectX12版本比N卡版本更快,建议分开使用。
2、用N卡30版本虚拟内存上限至少设置200G以上,建议300G+。
3、显卡驱动建议用Studio,不要用Game Ready,感觉studio更稳定。
4、分享仅代表我个人使用体验,仅供参考。


回复

使用道具 举报

216

主题

1998

帖子

68万

积分

管理员

Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96

积分
688467

隐世金马甲勋章超级版主勋章可爱萌新勋章见习版主勋章荣誉会员勋章男同管理员-无尚荣耀勋章优质版主勋章小有贡献勋章

发表于 2022-12-30 11:25:18 | 显示全部楼层
为啥不用N卡版本的dfl?
提供数字人直播服务、文字/音频驱动数字人服务,有意者联系我QQ563861181
全站默认解压密码dfldata.xyz
DFL交流QQ群五群974612885
AI绘画交流QQ群710238550
我的B站账号:特看科技的滚石   其他自称彦祖的不是我,请勿上当
回复 支持 反对

使用道具 举报

6

主题

418

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15665
发表于 2022-12-30 11:26:28 | 显示全部楼层
cuda是什么版本
回复 支持 反对

使用道具 举报

2

主题

32

帖子

543

积分

高级丹师

Rank: 5Rank: 5

积分
543
 楼主| 发表于 2022-12-30 11:34:33 | 显示全部楼层
滚石 发表于 2022-12-30 11:25
为啥不用N卡版本的dfl?

RTX3000就是那个N卡30系版本的
回复 支持 反对

使用道具 举报

2

主题

32

帖子

543

积分

高级丹师

Rank: 5Rank: 5

积分
543
 楼主| 发表于 2022-12-30 11:37:24 | 显示全部楼层

cuda 12.0.94
回复 支持 反对

使用道具 举报

11

主题

388

帖子

3288

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3288
发表于 2022-12-30 11:45:45 | 显示全部楼层
1.不知道
2.自己手动更新一下环境里的numpy即可
3.凑合就别凑合了,1120解决就好了
回复 支持 反对

使用道具 举报

6

主题

418

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15665
发表于 2022-12-30 11:48:09 | 显示全部楼层

换11.4试试看
回复 支持 反对

使用道具 举报

2

主题

32

帖子

543

积分

高级丹师

Rank: 5Rank: 5

积分
543
 楼主| 发表于 2022-12-30 11:51:09 | 显示全部楼层
IAW 发表于 2022-12-30 11:45
1.不知道
2.自己手动更新一下环境里的numpy即可
3.凑合就别凑合了,1120解决就好了 ...

求问怎么手动更新numpy啊
回复 支持 反对

使用道具 举报

2

主题

32

帖子

543

积分

高级丹师

Rank: 5Rank: 5

积分
543
 楼主| 发表于 2022-12-30 11:55:28 | 显示全部楼层

感谢,我试一下,不过这个跟我自己的cuda版本也有关系吗,那_internal文件夹里的CUDA文件夹是干什么用的啊
回复 支持 反对

使用道具 举报

6

主题

418

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15665
发表于 2022-12-30 12:04:32 | 显示全部楼层
asd96533 发表于 2022-12-30 11:55
感谢,我试一下,不过这个跟我自己的cuda版本也有关系吗,那_internal文件夹里的CUDA文件夹是干什么用的 ...

我也不太懂,但是听说dfl是在11.4基础上比较适配,而且dfl好久没更新了,所以我觉着你可以试试换版本
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-25 09:49 , Processed in 0.158208 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表