deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 959|回复: 9

pytorch版训练有什么优势?

[复制链接]

36

主题

307

帖子

9685

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
9685
 楼主| 发表于 2026-3-18 23:21:28 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
请问一下大佬们,pytorch版和tf版在训练上有什么优势吗?
pytorch版能直接修改模型分辨率,除了这个以为应该就没什么优势了吧?
我是AMD显卡,现在他们修改的pytorch版应该都跑不了,所以我把神农汉化3.06dml环境的弄了一个pytorch版试试,发现a卡跑pytorch版又慢又不能乡dml那样把模型放内存上。

回复

使用道具 举报

15

主题

3689

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
20773

真我风采勋章万事如意节日勋章

发表于 2026-3-19 03:07:03 | 显示全部楼层
本帖最后由 wtxx8888 于 2026-3-19 12:09 编辑

原版TF,就能改解析度。P版 有个毛的优势。
P版也就对50的支持 好点,其他的 都不如TF。
自己看看,别人用过后的 回复。。。
求补档 猫之汉化Deepfacelab 2026新春情人节pytorch版-综合讨论-deepfacelab中文网 - Powered by Discuz!
回复 支持 1 反对 1

使用道具 举报

0

主题

19

帖子

2786

积分

初级丹圣

Rank: 8Rank: 8

积分
2786
发表于 2026-3-19 22:29:49 | 显示全部楼层
Pytorch版是针对RTX GPU 50 系列开发
假如你是 50 系列,那么运算方式是兼容的
(但需高级工程设计师对TensorFlow到PyTorch模型转换的深厚技术与大量的错误修正累积实践)
而一般 RTX 10 20 30 40 系列,用TensorFlow是相对稳定可靠的
当然取决于你个人操作喜好为主,使用Pytorch或TensorFlow这部分未定论
举例来说:
卷积层差异TensorFlow的padding="same"需通过计算padding值实现(如padding=15)。
PyTorch的输入格式为(batch_size, in_channels, seq_length),需调整输入顺序。
批归一化层差异:参数命名一致,但需确保输入维度匹配。
等。。。

回复 支持 1 反对 0

使用道具 举报

11

主题

108

帖子

1099

积分

初级丹圣

Rank: 8Rank: 8

积分
1099
发表于 2026-3-19 13:09:18 | 显示全部楼层
呃,比tf好
回复

使用道具 举报

11

主题

108

帖子

1099

积分

初级丹圣

Rank: 8Rank: 8

积分
1099
发表于 2026-3-19 13:13:28 | 显示全部楼层
大部分人用的应该还是mve的那个,mve的改了loss函数,到原版会变糊,没了,实际上没什么区别
回复 支持 反对

使用道具 举报

2

主题

74

帖子

1020

积分

初级丹圣

Rank: 8Rank: 8

积分
1020

万事如意节日勋章

发表于 2026-3-20 09:36:55 | 显示全部楼层
forumphp 发表于 2026-3-19 22:29
Pytorch版是针对RTX GPU 50 系列开发
假如你是 50 系列,那么运算方式是兼容的
(但需高级工程设计师对Tenso ...

你说的好像比较专业啊。
回复 支持 反对

使用道具 举报

60

主题

481

帖子

2454

积分

初级丹圣

Rank: 8Rank: 8

积分
2454
发表于 2026-4-3 21:59:58 | 显示全部楼层
魔改P版很牛,很多实用功能
回复 支持 反对

使用道具 举报

10

主题

75

帖子

3299

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3299

万事如意节日勋章

发表于 2026-4-5 19:35:53 | 显示全部楼层
wtxx8888 发表于 2026-3-19 03:07
原版TF,就能改解析度。P版 有个毛的优势。
P版也就对50的支持 好点,其他的 都不如TF。
自己看看,别人 ...

大佬,MVEfork_合体版 还更不更啊?等了一年多了
回复 支持 反对

使用道具 举报

15

主题

3689

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
20773

真我风采勋章万事如意节日勋章

发表于 2026-4-5 20:26:39 | 显示全部楼层
本帖最后由 wtxx8888 于 2026-4-5 20:36 编辑
xsfxc 发表于 2026-4-5 19:35
大佬,MVEfork_合体版 还更不更啊?等了一年多了

新的写了,CUDA是Torch版的 支持50系,这又 没什么难度。。。
目前在测试 新的功能(切脸加速,新的人脸检测器等等,一系列新代码)
考虑发布的形式,免费 没动力呀。。。
回复 支持 反对

使用道具 举报

15

主题

3689

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
20773

真我风采勋章万事如意节日勋章

发表于 2026-4-7 03:50:22 | 显示全部楼层
本帖最后由 wtxx8888 于 2026-4-7 14:34 编辑

pytorch版的DML,确实慢得要死,是TFDML耗时的 两倍以上。
所以A卡,就不要想训练速度了,tensorflow2.10.0 加0.4.0DML(PY3.10),也 还是那个速度。
A卡的"CUDA" 叫ROCm,只支持WIN 11,烂的一批。只能还走 DML。
DML下的A卡,不能FP16,不能混合精度。啥 都没有!就是个 能启动的水准!高阶功能 全没有!
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2026-5-8 06:16 , Processed in 0.095459 second(s), 38 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表