deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1347|回复: 5

为什么df-ud模型比df-udt还大?bs开的低?

[复制链接]

10

主题

320

帖子

3099

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3099

万事如意节日勋章

 楼主| 发表于 2022-10-8 10:04:06 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
同参数的df-ud和df-udt模型,384,512 96 96 32

dfud的模型4.2G,dfudt的3.3G
对了一下,udt的decoder、encoder大一些,但inter、src_dst_opt比ud的小了很多,尤其是inter大小差了3倍
这几个分别代表啥啊?到底哪种练出来更像?
不是理论上udt的更吃资源么?但我ud的还比udt的少开几个bs,为什么呢?
微信图片_20221008100228.png
回复

使用道具 举报

17

主题

125

帖子

1002

积分

初级丹圣

Rank: 8Rank: 8

积分
1002
发表于 2022-10-8 11:50:25 | 显示全部楼层
你新建一个同参数的看看大小,应该是训练时间不一样大小也不一样,好像纯df不加u,d,t的更大
回复 支持 反对

使用道具 举报

4

主题

189

帖子

5033

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5033
发表于 2022-10-8 16:16:06 | 显示全部楼层
1006385231 发表于 2022-10-8 11:50
你新建一个同参数的看看大小,应该是训练时间不一样大小也不一样,好像纯df不加u,d,t的更大 ...

模型除了data.dat文件其他文件和训练时间没关系的,训练多久都不会变
回复 支持 反对

使用道具 举报

10

主题

320

帖子

3099

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3099

万事如意节日勋章

 楼主| 发表于 2022-10-8 19:02:53 | 显示全部楼层
hudabing 发表于 2022-10-8 16:16
模型除了data.dat文件其他文件和训练时间没关系的,训练多久都不会变

对,模型大小不会变的
我就没懂为什么带T的反而模型小,占资源也少些,能多开2-4个BS
回复 支持 反对

使用道具 举报

59

主题

458

帖子

2326

积分

初级丹圣

Rank: 8Rank: 8

积分
2326
发表于 2022-10-11 11:15:12 | 显示全部楼层
zqszhuce 发表于 2022-10-8 19:02
对,模型大小不会变的
我就没懂为什么带T的反而模型小,占资源也少些,能多开2-4个BS ...

建议玩 df-udt的。df-ud 没df-udt见效快。万能神丹都不行。。效果始终比 df-udt的差点  我以前下载了很多ud的丹 全部删了。
回复 支持 反对

使用道具 举报

10

主题

320

帖子

3099

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3099

万事如意节日勋章

 楼主| 发表于 2022-10-12 16:51:59 | 显示全部楼层
qiuyuande 发表于 2022-10-11 11:15
建议玩 df-udt的。df-ud 没df-udt见效快。万能神丹都不行。。效果始终比 df-udt的差点  我以前下载了很多u ...

我就是在练新的udt丹,论坛没找到合适的参数
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-25 19:23 , Processed in 0.140042 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表