deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
楼主: sinksky

发现补角度的绝佳方法!

[复制链接]

1

主题

48

帖子

831

积分

高级丹师

Rank: 5Rank: 5

积分
831

万事如意节日勋章

发表于 2025-5-22 23:17:37 | 显示全部楼层
下了试试效果
回复 支持 反对

使用道具 举报

44

主题

1036

帖子

5376

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
5376

万事如意节日勋章开心娱乐节日勋章

发表于 2025-5-23 00:41:06 | 显示全部楼层
试了下 不像 , 看帧图感觉在慢慢表老,那个唇纹特假
回复 支持 反对

使用道具 举报

37

主题

531

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
16251
发表于 2025-5-23 04:36:30 | 显示全部楼层
用wan2.1,32g的高精度itv模型可以做到无损补任何角度和表情,不过门槛太高,显卡24g起步,内存64g起步
回复 支持 反对

使用道具 举报

9

主题

136

帖子

1347

积分

初级丹圣

Rank: 8Rank: 8

积分
1347

稀奇古怪节日勋章

发表于 2025-5-23 18:32:07 | 显示全部楼层
dfl9999 发表于 2025-5-23 04:36
用wan2.1,32g的高精度itv模型可以做到无损补任何角度和表情,不过门槛太高,显卡24g起步,内存64g起步 ...

远程租一台搞,补完角度回来本地练
回复 支持 反对

使用道具 举报

9

主题

136

帖子

1347

积分

初级丹圣

Rank: 8Rank: 8

积分
1347

稀奇古怪节日勋章

发表于 2025-5-24 21:40:46 | 显示全部楼层
fengjunwei 发表于 2025-5-22 17:30
即梦3.0的5秒一致性确实比可灵2.0强一些,不过如果你仔细看还是会发现脸部细微变化的,毕竟没LORA。

你真 ...

请教下这个lora怎么训练,有没有什么文档
回复 支持 反对

使用道具 举报

0

主题

39

帖子

771

积分

高级丹师

Rank: 5Rank: 5

积分
771

万事如意节日勋章

发表于 2025-5-24 23:09:36 | 显示全部楼层
本帖最后由 fengjunwei 于 2025-5-24 23:35 编辑
国际狄拉克 发表于 2025-5-24 21:40
请教下这个lora怎么训练,有没有什么文档

https://github.com/tdrussell/diffusion-pipe

这个是训练器,可以训练wan2.1,hunyuan等。不推荐用比如汤团猪之类的训练器,虽然是差不多的框架,但是实际测试下来同素材出来的效果差太多,训练的时候每张图片设定每轮只看1次,别什么设置看好几次,训练设置2e-5,不开FP8效果佳,BS其实不用太高,设置2就行,太高影响泛化。

如果是打算练人物,推荐用hunyuan模型,训练出来的lora是多注意力模型,之后你无论是文生视频,还是把人物和你训练的场景一起用,人物相似度能达到95%,卡通和3D人物能达到99%

如果打算训练图生视频辅助,那训练win2.1的lora也可以,但是因为是单注意力模型,所以你如果没有图片,自己生成人物,那么相似度也就80%到90%

也没什么训练文档,其实很简单,用图片训练的话和SD差不多,只不过打标文件要用自然语句,不是用一个个关键词标签。如果是训练人物,那么达标要描述详细比如(XX人,照片中的年轻女子一头乌黑的长发,佩戴着雪花形状的精致银簪。她面容清秀,发丝纤细,目光微微偏向左侧,表情宁静祥和。她头部微微上扬,身体向前。她身着优雅的浅蓝色连衣裙,图案精致,袖口飘逸。她还戴着一条串珠项链。这张照片是一张半身照,拍摄角度略低,柔和的灯光凸显了她的五官,并投射出柔和的阴影。)

如果用视频训练动作,那不要写太复杂比如(XX人和狗打架,视频中一个女人和一直狗在打架,女人做了什么动作,狗做了什么动作)就完事了,不要描写太多,不然影响泛化,这样你就可以把你练的任何人物LORA替换成你训练的这个女人和这只狗打的视频中的女人。

用视频训练的话对显卡要求非常高,所以把视频切割成5秒每秒16帧,然后给每个视频打标记,如果只是训练简单动作或场景,8个5秒视频,一共跑1600步就够了,每多一个视频加200步,显卡好的话几小时,显卡差就切割成2秒一段,分辨率改成很低,比如512X288,384X384,那么勉强开内存交换16G能跑,但是这样也就只能训练动作了,要用视频训练人物长相起码视频能有960X960分辨率,这样的视频训练要求4090 48G起步,所以一般来说训练人物用图片就够了,960X960的图片话开内存交换30,16G也能跑。

回复 支持 1 反对 0

使用道具 举报

9

主题

136

帖子

1347

积分

初级丹圣

Rank: 8Rank: 8

积分
1347

稀奇古怪节日勋章

发表于 2025-5-25 02:54:49 | 显示全部楼层
fengjunwei 发表于 2025-5-24 23:09
https://github.com/tdrussell/diffusion-pipe

这个是训练器,可以训练wan2.1,hunyuan等。不推荐用比如 ...

牛逼!!!
回复 支持 反对

使用道具 举报

45

主题

835

帖子

6344

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6344

万事如意节日勋章开心娱乐节日勋章

发表于 2025-5-26 00:24:34 | 显示全部楼层
sinksky 发表于 2025-5-22 22:19
用我给的提示词不用抽,基本一两次就能用,就给src的脸图就行了

src有刘海,可以使用即梦让她变成光头吗?
我使用豆包的ai生图,可以变成光头,但相似度几乎消失了
回复 支持 反对

使用道具 举报

45

主题

835

帖子

6344

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6344

万事如意节日勋章开心娱乐节日勋章

发表于 2025-5-26 00:26:44 | 显示全部楼层
fengjunwei 发表于 2025-5-22 17:30
即梦3.0的5秒一致性确实比可灵2.0强一些,不过如果你仔细看还是会发现脸部细微变化的,毕竟没LORA。

你真 ...

即梦或者可灵可以使src变成光头吗
src有刘海
回复 支持 0 反对 1

使用道具 举报

9

主题

136

帖子

1347

积分

初级丹圣

Rank: 8Rank: 8

积分
1347

稀奇古怪节日勋章

发表于 2025-5-26 00:41:52 | 显示全部楼层
fengjunwei 发表于 2025-5-24 23:09
https://github.com/tdrussell/diffusion-pipe

这个是训练器,可以训练wan2.1,hunyuan等。不推荐用比如 ...

hunyuan的图片lora练几个epoch有说法吗?我看配置文件默认是1000epoch
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-6-3 05:59 , Processed in 0.112334 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表