deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 938|回复: 3

大佬们,n卡影响dfl训练效率的参数有哪些?

[复制链接]

16

主题

80

帖子

3024

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3024

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2023-2-22 12:24:19 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评

新出的40系看各种跑分评测好像是比30系同定位的显卡强一些,但是CUDA和位宽都遭到了大砍,这两个参数对训练速度的影响大吗?
比如移动端3060位宽192 CUDA3840,4060位宽128 CUDA3072,会不会4060在训练方面还不如3060?
还有就是显存是不是只影响模型的上限,与训练速度无关
回复

使用道具 举报

40

主题

477

帖子

5310

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5310
发表于 2023-2-22 19:07:18 | 显示全部楼层
最近发布的几款4060笔记本对臭打游戏的来说太值了,可是砍掉的参数对DFL又有比较大的影响,很难抉择啊,我觉得万元内兼顾游戏和DFL的只有搭载3070的笔记本,5120CUDA核心,256位宽,8G显存

以下回答复制于知乎:
1.GPU架构:GPU架构指的是硬件的设计方式,例如流处理器簇中有多少个core、是否有L1 or L2缓存、是否有双精度计算单元等等。每一代的架构是一种思想,如何去更好完成并行的思想,而芯片就是对上述思想的实现。目前N家主流架构有图灵(Turing)、帕斯卡(Pascal)、开普勒(Kepler)、Volta等。一般GPU加速卡以GPU架构命名其型号的首字母,如:P100为帕斯卡(Pascal)架构。当然也有类似2080ti这种命名方式,其为图灵(Turing)架构(我觉得目的是区分Tesla,不知道对不对)。
2.CUDA单元数:CUDA(Compute Unified Device Architecture)是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 基本上目前做深度学习的话没有人不知道CUDA的大名吧,这个单元数直接影响GPU的计算性能。
3.Tensor核心数:我们知道在深度学习中大量的运算都是在高维矩阵(张量 Tensor)间进行的,Tensor Core可以让tensor的计算速度急速上升。Tensor Core专业执行矩阵数学运算,适用于深度学习和某些类型的HPC。Tensor Core执行融合乘法加法,其中两个4*4 FP16矩阵相乘,然后将结果添加到4*4 FP16或FP32矩阵中,最终输出新的4*4 FP16或FP32矩阵。NVIDIA将Tensor Core进行的这种运算称为混合精度数学,因为输入矩阵的精度为半精度,但乘积可以达到完全精度。碰巧的是,Tensor Core所做的这种运算在深度学习训练和推理中很常见。Tensor Core在GPU里处理的是大型矩阵运算,而不是简单地单指令流多数据流标量运算。虽然它在执行标量运算时的表现很糟糕,但它可以将更多的操作打包到同一个芯片区域。
4.显存带宽:显存带宽是指显示芯片与显存之间的数据传输速率。据我的观察,如果我们在做图像方面的深度学习研究的话,一个具有较大显存带宽的GPU允许你在设置较大的batch_size,也就是你可以同时拿出来较多的数据来一起训练。
5.显存容量:显存容量是显卡上显存的容量数,显存容量决定着显存临时存储数据的多少。还是举做图像方面的研究的例子,一个较大的显存容量能让你一次性把更多的训练图片读入内存中,甚至可以将整个数据集直接存入一个变量里面,感觉比写个像tfrecord这种队列或者堆栈去慢慢读数据要爽的多,至少可以解决shuffle不充分的问题嘛~
6.双/单/半精度计算性能:这个当然是最重要的,这个指标就是GPU在处理FP64/FP32/FP16不同精度的浮点数时的浮点计算能力。对于浮点计算来说,CPU可以同时支持不同精度的浮点运算,但在GPU里针对单精度和双精度就需要各自独立的计算单元。所以这里就要看所做项目是否有必要到双精度计算的级别,一般来说深度学习计算中精度要求都很低,没有哪个权值矩阵小数点后十几位的变化对最终结果有较大影响的,不然就要考虑是不是病态了。
回复 支持 反对

使用道具 举报

16

主题

80

帖子

3024

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3024

万事如意节日勋章开心娱乐节日勋章

 楼主| 发表于 2023-2-23 08:33:24 | 显示全部楼层
masker 发表于 2023-2-22 19:07
最近发布的几款4060笔记本对臭打游戏的来说太值了,可是砍掉的参数对DFL又有比较大的影响,很难抉择啊,我 ...

谢谢大佬也就是说这两个参数对DFL的影响还是挺大的吧
回复 支持 反对

使用道具 举报

40

主题

477

帖子

5310

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5310
发表于 2023-2-23 18:32:19 | 显示全部楼层
sad123asdaa 发表于 2023-2-23 08:33
谢谢大佬也就是说这两个参数对DFL的影响还是挺大的吧

是的,不过4060首发还是挺香的,但我没抢到
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-24 22:41 , Processed in 0.135073 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表