deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 86|回复: 5

Wan2.1 Infinitetalk 对口型无限时长数字人视频生成

[复制链接]

17

主题

135

帖子

8633

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8633
 楼主| 发表于 昨天 13:06 | 显示全部楼层 |阅读模式
本帖最后由 a931386 于 2025-8-28 13:08 编辑



22.png


------------------------------------------------------------------


工作流链接: https://pan.baidu.com/s/1CqhlWQpW2evz_wHss0gWog?pwd=49hc 提取码: 49hc




Infinitetalk使用的是Wan2.1的模型架构
可参考下面连结的工作流程

Wan2.1图生视频,Comfyui一键生成涩图,换脸高清修復一体包

------------------------------------------------------------------
ComfyUI\models\diffusion_models


wan2.1_i2v_480p_14B_fp8_scaled.safetensors

Wan2_1-InfiniTetalk-Single_fp16

ComfyUI\models\vae


Wan2_1_VAE_bf16

ComfyUI\models\text_encoders

umt5_xxl_fp8_e4m3fn_scaled.safetensors

ComfyUI\models\clip_vision

clip_vision_h.safetensors

ComfyUI\models\Loras


lightx2v_I2V_14B_480p_cfg_step_distill_rank256_bf16.safetensors



红框输入解析度、总帧数(1秒=25)、上传音频与图片



4090 48GB
测试解析度1280X720、单个影片81帧5秒要5分钟
显存佔用36GB
和Wan2.1大同小异



33.png







回复

使用道具 举报

48

主题

889

帖子

6768

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6768

万事如意节日勋章开心娱乐节日勋章

发表于 昨天 15:32 | 显示全部楼层
本帖最后由 WaveBedo 于 2025-8-28 15:33 编辑

视频说话的声音,
有办法改成另外一个人的声音吗
而且要保持原视频的嘴型
试过剪映的,似乎效果不佳啊

目前有其他的办法吗
回复 支持 反对

使用道具 举报

17

主题

135

帖子

8633

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8633
 楼主| 发表于 昨天 15:35 | 显示全部楼层
WaveBedo 发表于 2025-8-28 15:32
视频说话的声音,
有办法改成另外一个人的声音吗
而且要保持原视频的嘴型

一般都是用Sovits或Rvc做模型訓練轉換,B站上的換口型通常都會替換原視頻的嘴型
回复 支持 反对

使用道具 举报

48

主题

889

帖子

6768

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6768

万事如意节日勋章开心娱乐节日勋章

发表于 昨天 15:50 | 显示全部楼层
a931386 发表于 2025-8-28 15:35
一般都是用Sovits或Rvc做模型訓練轉換,B站上的換口型通常都會替換原視頻的嘴型 ...

也就是没有办法保持原来的嘴型,是吧
那相当于嘴型被修改了,这应该会降低原来视频的真实感吧

我希望的是语速一样,嘴型一样,尽量维持原样
回复 支持 反对

使用道具 举报

48

主题

889

帖子

6768

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
6768

万事如意节日勋章开心娱乐节日勋章

发表于 昨天 17:40 | 显示全部楼层
a931386 发表于 2025-8-28 15:35
一般都是用Sovits或Rvc做模型訓練轉換,B站上的換口型通常都會替換原視頻的嘴型 ...

重新测试了一下剪映,
发现是可行的,
测试了多个人声,
嘴型都跟原来的一样
回复 支持 反对

使用道具 举报

17

主题

135

帖子

8633

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
8633
 楼主| 发表于 昨天 23:30 | 显示全部楼层
WaveBedo 发表于 2025-8-28 15:50
也就是没有办法保持原来的嘴型,是吧
那相当于嘴型被修改了,这应该会降低原来视频的真实感吧

使用視頻作為來源進行替換嘴型是對的上
但要是換作是別的音源
例如讓老三國曹老闆唱「東漢末年分三國、烽火連篇不休」
口型會不一樣吧
換口型主要使用是替換音源為主
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-8-29 01:31 , Processed in 0.105734 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表