这种问题在音乐领域怎么称呼?
本帖最后由 Pxhpanic 于 2024-2-6 15:18 编辑声音链接:https://pan.baidu.com/s/1yEjceSFLnzoyqtDe3GJJNw?pwd=1dxq
这是通过 svc 项目推理的声音,声音源来自游戏语音包,所以说训练素材是非常干净的
但是推理出来的声音并不干净有许多不舒服的声音,于是我用 au 进行处理,降噪、去嘶声、去齿音、响度匹配分别尝试,均不能得到好的效果
我应该怎么处理得到干净的声音?
而产生这种不干净的声音是不是因为我在数据重采样时,并没有用专业软件处理响度导致的?
因为没有音乐领域的相关知识,我不知道我遇到的这种问题是怎么定义的,所以将推理声音放在这里,看看是否有过路的大佬诊断诊断
干净不干净直接耳朵听,你重采样后的音频直接耳朵听看是否是干净的 滚石 发表于 2024-2-6 15:29
干净不干净直接耳朵听,你重采样后的音频直接耳朵听看是否是干净的
噢噢感谢听了下重采样输出目录,确实是重采样的问题,音质受损挺多的 之前没想到可以查重采样的输出:( 居然还有这种问题。是说训练素材要处理响度?
seancai110 发表于 2024-2-6 23:06
居然还有这种问题。是说训练素材要处理响度?
在svc项目中是这样的 Pxhpanic 发表于 2024-2-7 11:35
在svc项目中是这样的
好吧,还好我声音都是用剪映剪辑的。剪映默认的响度是压限到-20db seancai110 发表于 2024-2-7 12:06
好吧,还好我声音都是用剪映剪辑的。剪映默认的响度是压限到-20db
说到剪映顺便问一手 在剪映中如何批量调整音频的响度? 几千条音频 一条一条弄太麻烦了
我没有找到任何有关批量匹配响度的教程 Pxhpanic 发表于 2024-2-7 15:33
说到剪映顺便问一手 在剪映中如何批量调整音频的响度? 几千条音频 一条一条弄太麻烦了
我没有找到 ...
全部拖到时间线。全选就行。或者缩放后在时间线上框选。但是剪映没有压限功能哦,都是统一调整增减音量。
不过剪映好像输出的时候都是压限到-20db的,所以不调直接输出也不会爆音。
但是我也不高tts,不知道你这几千条是一定要分开还是合成一条也行 seancai110 发表于 2024-2-7 20:00
全部拖到时间线。全选就行。或者缩放后在时间线上框选。但是剪映没有压限功能哦,都是统一调整增减音量。 ...
噢大概明白了谢谢
音频得分开否则会oom
页:
[1]