15
3666
2万
高级丹圣
day270010678 发表于 2026-4-8 15:47 不知道你的逻辑是什么,我问你在pytorch环境里面,纯张量NCHW操作高效稳定还是频繁cpu和gpu转换numpy层面 ...
使用道具 举报
30
201
1507
初级丹圣
wtxx8888 发表于 2026-4-8 17:43 兼容性不要?你Torch出的,回不去原版,有屁用? 要速度快?一个混合精度,就足够起飞!差那点 转换的损耗 ...
day270010678 发表于 2026-4-8 23:19 竟扯淡,fp16和fp32,一个天,一个地,真以为这点精度没影响啊,你混合去试验下,就这点精度能让你彻底增 ...
wtxx8888 发表于 2026-4-9 00:08 前向后向 FP16,梯度FP32,权重文件是 FP32,才叫混合精度! 俄罗斯原版崩 是全量FP16,梯度与存档 都是FP ...
0
120
2480
day270010678 发表于 2026-4-9 10:19 我感觉对牛弹琴了,我以为我们谈的都是前期阶段,因为说到权重文件了,呃,我现在发现你所谓的混合精度是 ...
july 发表于 2026-4-9 11:31 leeso那个魔改版应该就是这么实现的,用了半年多了,兼容原版模型,很稳 出于用户体验,兼容原版才是最好 ...
敢于展现自我风采,秀出青春年华的会员
年年顺景胜人意,日日兴隆通四海
|Archiver|手机版|deepfacelab中文网 |网站地图
GMT+8, 2026-4-13 02:02 , Processed in 0.118574 second(s), 29 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.