deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1129|回复: 7

3张4090为啥跑起来还不如一张快

[复制链接]

2

主题

13

帖子

348

积分

初级丹师

Rank: 3Rank: 3

积分
348
 楼主| 发表于 2024-4-10 15:20:01 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
3张4090为啥跑起来还不如一张快?刚买了3张4090猛禽 都是pcie也都是X16的 电源长城2600W的最高端的  为何3张卡一起跑速度比一张慢四五倍的样子 而且CPU占用率100%  有办法解决么  
微信图片_20240410151903.png
回复

使用道具 举报

9

主题

217

帖子

3389

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3389
QQ
发表于 2024-4-10 16:17:42 | 显示全部楼层
没有nvlink的话多显卡比单显卡慢,因为他的batch 是平均分配到每个显卡的,对卡间通信要求很高.
但是三个4090可以跑三个模型各跑各的,速度不会变慢
回复 支持 反对

使用道具 举报

2

主题

13

帖子

348

积分

初级丹师

Rank: 3Rank: 3

积分
348
 楼主| 发表于 2024-4-10 16:35:25 | 显示全部楼层
yxyao 发表于 2024-4-10 16:17
没有nvlink的话多显卡比单显卡慢,因为他的batch 是平均分配到每个显卡的,对卡间通信要求很高.
但是三个40 ...

三个各自跑速度是正常的 但是4090没有桥接口比较蛋疼 还不如3090
回复 支持 反对

使用道具 举报

9

主题

217

帖子

3389

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3389
QQ
发表于 2024-4-10 16:56:42 | 显示全部楼层
熊熊 发表于 2024-4-10 16:35
三个各自跑速度是正常的 但是4090没有桥接口比较蛋疼 还不如3090

如果不跑大模型,可以三个单独跑,更能直接对比测试不同模型参数或数据集或训练方法的区别优劣。
如果想跑大模型,可以趁现在4090高价转手,买专业卡比如rtx A6000
回复 支持 反对

使用道具 举报

21

主题

508

帖子

4858

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4858

万事如意节日勋章

发表于 2024-4-10 20:06:38 | 显示全部楼层
因为能变快,专业卡怎么卖
回复 支持 反对

使用道具 举报

1

主题

89

帖子

2060

积分

初级丹圣

Rank: 8Rank: 8

积分
2060

节日欢乐之星勋章

发表于 2024-4-11 11:28:35 | 显示全部楼层
4090不是不支持交火吗?
回复 支持 反对

使用道具 举报

14

主题

82

帖子

797

积分

高级丹师

Rank: 5Rank: 5

积分
797
发表于 2024-4-11 23:54:11 | 显示全部楼层
哈哈,我最近就是在研究交火的问题!最后现在在思考买rtx 6000ada,还是l40,还是a100,还是h800! 单精度算力我还没研究清楚哪个性价比高!所以还没买,现在我电脑用的是4090d
回复 支持 反对

使用道具 举报

2

主题

13

帖子

348

积分

初级丹师

Rank: 3Rank: 3

积分
348
 楼主| 发表于 2024-5-27 16:18:43 | 显示全部楼层
sd4981480 发表于 2024-4-11 11:28
4090不是不支持交火吗?

3090以后都没有桥接口了
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-22 21:57 , Processed in 0.147422 second(s), 38 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表