deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 369|回复: 0

df-dut 416-512-90-90预训练模型

[复制链接]

44

主题

583

帖子

2万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
22751
 楼主| 发表于 4 天前 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 dfl9999 于 2025-10-10 20:14 编辑

1000062040.jpg


这应该是论坛第一款在预训练阶段用余弦退火+强开扭曲收敛的模型,通过对8万张离散素材进行扭曲训练到清晰,避免了模型死记硬背特定素材结构,同时加速正训阶段随机扭曲的速度,由于软件本身在预训练阶段不支持开启扭曲,即便改代码强开也会导致模型发散,进行了一系列的实验和微调,最后成功了。
由于4090d卖了,5090正在路上,目前没有办法验证模型正训效果和稳定性,先放上来再说吧。





评分

参与人数 1贡献 +1 收起 理由
IAW + 1 挺猛的

查看全部评分

回复

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-10-13 23:46 , Processed in 0.118074 second(s), 35 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表