deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 549|回复: 3

突发奇想,DF 模型原理的一个有趣类比

[复制链接]

3

主题

29

帖子

350

积分

初级丹师

Rank: 3Rank: 3

积分
350
 楼主| 发表于 2026-1-2 02:24:58 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
本帖最后由 ulu 于 2026-1-3 04:09 编辑

image.png


学习DF架构换脸原理后想到一个场景:(目击者负责把图像变为文字描述,即编码器,刑侦专家是解码器)
训练过程
(即已经有嫌疑人长相的照片的情况,但是刑侦专家不提前看照片,等画像后再和嫌疑人的照片进行比对):
目击者描述嫌疑犯的特征,把嫌疑犯的图像转换为,刑侦专家根据文字描述和自己对人脸的理解开始作画。
image.png
作画后会比对嫌疑犯长相,比对偏差了多少(loss 值)。
然后刑侦专家用电棍/普通警棍抽目击者,告诉目击者哪里说的不准让其调整描述(反向传播)。
如果用电棍抽,目击者会更多的修改描述,可能会改的太多偏差过大。(学习率过大)。
一轮训练完成,然后不断重复,等到比较接近嫌疑犯的时候,改用普通警棍。(学习率下调)
如此反复,目击者挨了很多轮次的毒打后,描述会逐渐逼近嫌疑犯,同时画师的水准也在上升
解码器 A 解码器 B 可以理解为画风不同的刑侦专家,能力不同。
刑侦专家 B,即不管画谁都像 B 的水平一般的刑侦专家。(或者诚心要害死 B )
换脸过程:目击者提供 A 的描述,刑侦专家 B 画出了 B

刚来论坛不久,很多东西都需要学。看到这个帖子想到就写出来了。
其他参数因为理解不深没写如果有好的类比欢迎补充,增加对原理的理解。
Liae 的还没想好怎么写。



回复

使用道具 举报

49

主题

362

帖子

4841

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4841

万事如意节日勋章

发表于 2026-1-2 13:27:29 | 显示全部楼层
表达能力有待加强
回复 支持 2 反对 0

使用道具 举报

91

主题

1675

帖子

8700

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8700

万事如意节日勋章开心娱乐节日勋章

发表于 2026-1-3 10:22:27 | 显示全部楼层
大多数是想看实用的,不想看理论一大堆的
回复 支持 1 反对 0

使用道具 举报

3

主题

29

帖子

350

积分

初级丹师

Rank: 3Rank: 3

积分
350
 楼主| 发表于 2026-1-4 07:25:06 | 显示全部楼层
本帖最后由 ulu 于 2026-1-4 07:30 编辑
mzh920 发表于 2026-1-3 10:22
大多数是想看实用的,不想看理论一大堆的

看了很多大佬的帖子,除去大家都懂得的道理,其他很大一部分都是在各说各话。比如说某些参数,不同人的理解可能是完全相反的。如果不懂理论很容易不知道哪个是对哪个是错的,更分不清哪些实用的了。不清楚理论的话就通通照搬,需要花的时间成本过高,拿来主义的弊端。
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2026-2-18 06:53 , Processed in 0.107173 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表