deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 22|回复: 0

突发奇想,DF 模型原理的一个有趣类比

[复制链接]

2

主题

12

帖子

92

积分

高级丹童

Rank: 2

积分
92
 楼主| 发表于 5 小时前 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 ulu 于 2026-1-2 02:43 编辑

image.png


学习DF架构换脸原理后想到一个场景:
训练过程(已经知道嫌疑人长相的情况):
目击者(编码器)描述嫌疑犯,刑侦专家(解码器)根据描述开始作画。
image.png
作画后会比对嫌疑犯长相,比对偏差了多少(loss 值)。
然后刑侦专家用电棍/普通警棍抽目击者让其调整描述(反向传播)。
如果用电棍抽,目击者会更多的修改描述,可能会改的太多偏差过大。(学习率过大)。
一轮训练完成,然后不断重复,等到比较接近嫌疑犯的时候,改用普通警棍。(学习率下调)
如此反复,目击者挨了很多轮次的毒打后,描述会逐渐逼近嫌疑犯,同时画师的水准也在上升
解码器 A 解码器 B 可以理解为画风不同的刑侦专家,能力不同。
刑侦专家 B,即不管画谁都像 B 的水平一般的刑侦专家。(或者诚心要害死 B )
换脸过程:目击者提供 A 的描述,刑侦专家 B 画出了 B

刚来论坛不久,很多东西都需要学。看到这个帖子想到就写出来了。
其他参数因为理解不深没写如果有好的类比欢迎补充,增加对原理的理解。
Liae 的还没想好怎么写。


回复

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2026-1-2 08:15 , Processed in 0.114806 second(s), 33 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表