发现补角度的绝佳方法！

lovable520 · 发表于 2025-5-22 23:17:37

下了试试效果

pasanonic · 发表于 2025-5-23 00:41:06

试了下不像 , 看帧图感觉在慢慢表老,那个唇纹特假

dfl9999 · 发表于 2025-5-23 04:36:30

用wan2.1，32g的高精度itv模型可以做到无损补任何角度和表情，不过门槛太高，显卡24g起步，内存64g起步

国际狄拉克 · 发表于 2025-5-23 18:32:07

dfl9999 发表于 2025-5-23 04:36
用wan2.1，32g的高精度itv模型可以做到无损补任何角度和表情，不过门槛太高，显卡24g起步，内存64g起步 ...

远程租一台搞，补完角度回来本地练

国际狄拉克 · 发表于 2025-5-24 21:40:46

fengjunwei 发表于 2025-5-22 17:30
即梦3.0的5秒一致性确实比可灵2.0强一些，不过如果你仔细看还是会发现脸部细微变化的，毕竟没LORA。

你真 ...

请教下这个lora怎么训练，有没有什么文档

fengjunwei · 发表于 2025-5-24 23:09:36

本帖最后由 fengjunwei 于 2025-5-24 23:35 编辑

国际狄拉克发表于 2025-5-24 21:40
请教下这个lora怎么训练，有没有什么文档

https://github.com/tdrussell/diffusion-pipe

这个是训练器，可以训练wan2.1，hunyuan等。不推荐用比如汤团猪之类的训练器，虽然是差不多的框架，但是实际测试下来同素材出来的效果差太多，训练的时候每张图片设定每轮只看1次，别什么设置看好几次，训练设置2e-5，不开FP8效果佳，BS其实不用太高，设置2就行，太高影响泛化。

如果是打算练人物，推荐用hunyuan模型，训练出来的lora是多注意力模型，之后你无论是文生视频，还是把人物和你训练的场景一起用，人物相似度能达到95%，卡通和3D人物能达到99%

如果打算训练图生视频辅助，那训练win2.1的lora也可以，但是因为是单注意力模型，所以你如果没有图片，自己生成人物，那么相似度也就80%到90%

也没什么训练文档，其实很简单，用图片训练的话和SD差不多，只不过打标文件要用自然语句，不是用一个个关键词标签。如果是训练人物，那么达标要描述详细比如（XX人，照片中的年轻女子一头乌黑的长发，佩戴着雪花形状的精致银簪。她面容清秀，发丝纤细，目光微微偏向左侧，表情宁静祥和。她头部微微上扬，身体向前。她身着优雅的浅蓝色连衣裙，图案精致，袖口飘逸。她还戴着一条串珠项链。这张照片是一张半身照，拍摄角度略低，柔和的灯光凸显了她的五官，并投射出柔和的阴影。）

如果用视频训练动作，那不要写太复杂比如（XX人和狗打架，视频中一个女人和一直狗在打架，女人做了什么动作，狗做了什么动作）就完事了，不要描写太多，不然影响泛化，这样你就可以把你练的任何人物LORA替换成你训练的这个女人和这只狗打的视频中的女人。

用视频训练的话对显卡要求非常高，所以把视频切割成5秒每秒16帧，然后给每个视频打标记，如果只是训练简单动作或场景，8个5秒视频，一共跑1600步就够了，每多一个视频加200步，显卡好的话几小时，显卡差就切割成2秒一段，分辨率改成很低，比如512X288，384X384，那么勉强开内存交换16G能跑，但是这样也就只能训练动作了，要用视频训练人物长相起码视频能有960X960分辨率，这样的视频训练要求4090 48G起步，所以一般来说训练人物用图片就够了，960X960的图片话开内存交换30，16G也能跑。

国际狄拉克 · 发表于 2025-5-25 02:54:49

fengjunwei 发表于 2025-5-24 23:09
https://github.com/tdrussell/diffusion-pipe

这个是训练器，可以训练wan2.1，hunyuan等。不推荐用比如 ...

牛逼！！！

WaveBedo · 发表于 2025-5-26 00:24:34

sinksky 发表于 2025-5-22 22:19
用我给的提示词不用抽，基本一两次就能用，就给src的脸图就行了

src有刘海，可以使用即梦让她变成光头吗？
我使用豆包的ai生图，可以变成光头，但相似度几乎消失了

WaveBedo · 发表于 2025-5-26 00:26:44

fengjunwei 发表于 2025-5-22 17:30
即梦3.0的5秒一致性确实比可灵2.0强一些，不过如果你仔细看还是会发现脸部细微变化的，毕竟没LORA。

你真 ...

即梦或者可灵可以使src变成光头吗
src有刘海

国际狄拉克 · 发表于 2025-5-26 00:41:52

fengjunwei 发表于 2025-5-24 23:09
https://github.com/tdrussell/diffusion-pipe

这个是训练器，可以训练wan2.1，hunyuan等。不推荐用比如 ...

hunyuan的图片lora练几个epoch有说法吗？我看配置文件默认是1000epoch

		自动登录	找回密码
密码			立即注册（仅限QQ邮箱）

发现补角度的绝佳方法！

浏览过的版块

万事如意节日勋章

开心娱乐节日勋章

稀奇古怪节日勋章