deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 915|回复: 3

现在软件就停留在30系么

[复制链接]

8

主题

41

帖子

342

积分

初级丹师

Rank: 3Rank: 3

积分
342
 楼主| 发表于 2023-1-5 21:04:16 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
好像没有适配优化40系,那么40系现在用哪个版本呢?用0版本速度会不会比30显卡还慢呢
回复

使用道具 举报

216

主题

1998

帖子

68万

积分

管理员

Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96Rank: 96

积分
688467

隐世金马甲勋章超级版主勋章可爱萌新勋章见习版主勋章荣誉会员勋章男同管理员-无尚荣耀勋章优质版主勋章小有贡献勋章

发表于 2023-1-5 21:17:53 | 显示全部楼层
40系和30系一样。
分版本的原因是底层tensorflow搞了个2.0版本,导致30系之后的显卡和10、20系代码得分开单独写
30系之后的显卡都是和30系版本用一样的代码可运行
提供数字人直播服务、文字/音频驱动数字人服务,有意者联系我QQ563861181
全站默认解压密码dfldata.xyz
DFL交流QQ群五群974612885
AI绘画交流QQ群710238550
我的B站账号:特看科技的滚石   其他自称彦祖的不是我,请勿上当
回复 支持 反对

使用道具 举报

0

主题

9

帖子

290

积分

初级丹师

Rank: 3Rank: 3

积分
290
发表于 2023-1-8 21:26:03 | 显示全部楼层
滚石 发表于 2023-1-5 21:17
40系和30系一样。
分版本的原因是底层tensorflow搞了个2.0版本,导致30系之后的显卡和10、20系代码得分开单 ...

我用3090跑256迭代是886毫秒,什么都没换只换了4090迭代是596毫秒。理论上提升也就接近显卡给出的参数应有的提升了,因此感觉软件适配40系和30系都是最好的了,拙见,仅供参考。sorry版主点到你的回复了,是想回复楼主来着
回复 支持 反对

使用道具 举报

0

主题

22

帖子

529

积分

高级丹师

Rank: 5Rank: 5

积分
529
发表于 2023-1-10 14:50:40 | 显示全部楼层
toto_2013 发表于 2023-1-8 21:26
我用3090跑256迭代是886毫秒,什么都没换只换了4090迭代是596毫秒。理论上提升也就接近显卡给出的参数应有 ...

按照cuda数量计算,4090应该是有3090的1.6倍。你的模型的理论值在4090中应该是550ms,实际是3090的1.4倍左右。估计的显存的带宽拖了后腿。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-25 07:30 , Processed in 0.121646 second(s), 33 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表