Pxhpanic 发表于 2024-2-6 15:15:47

这种问题在音乐领域怎么称呼?

本帖最后由 Pxhpanic 于 2024-2-6 15:18 编辑

声音链接:https://pan.baidu.com/s/1yEjceSFLnzoyqtDe3GJJNw?pwd=1dxq


这是通过 svc 项目推理的声音,声音源来自游戏语音包,所以说训练素材是非常干净的


但是推理出来的声音并不干净有许多不舒服的声音,于是我用 au 进行处理,降噪、去嘶声、去齿音、响度匹配分别尝试,均不能得到好的效果
我应该怎么处理得到干净的声音?


而产生这种不干净的声音是不是因为我在数据重采样时,并没有用专业软件处理响度导致的?


因为没有音乐领域的相关知识,我不知道我遇到的这种问题是怎么定义的,所以将推理声音放在这里,看看是否有过路的大佬诊断诊断

滚石 发表于 2024-2-6 15:29:57

干净不干净直接耳朵听,你重采样后的音频直接耳朵听看是否是干净的

Pxhpanic 发表于 2024-2-6 15:52:30

滚石 发表于 2024-2-6 15:29
干净不干净直接耳朵听,你重采样后的音频直接耳朵听看是否是干净的

噢噢感谢听了下重采样输出目录,确实是重采样的问题,音质受损挺多的   之前没想到可以查重采样的输出:(

seancai110 发表于 2024-2-6 23:06:45

居然还有这种问题。是说训练素材要处理响度?

Pxhpanic 发表于 2024-2-7 11:35:57

seancai110 发表于 2024-2-6 23:06
居然还有这种问题。是说训练素材要处理响度?

在svc项目中是这样的

seancai110 发表于 2024-2-7 12:06:05

Pxhpanic 发表于 2024-2-7 11:35
在svc项目中是这样的

好吧,还好我声音都是用剪映剪辑的。剪映默认的响度是压限到-20db

Pxhpanic 发表于 2024-2-7 15:33:57

seancai110 发表于 2024-2-7 12:06
好吧,还好我声音都是用剪映剪辑的。剪映默认的响度是压限到-20db

说到剪映顺便问一手   在剪映中如何批量调整音频的响度?    几千条音频 一条一条弄太麻烦了
我没有找到任何有关批量匹配响度的教程

seancai110 发表于 2024-2-7 20:00:24

Pxhpanic 发表于 2024-2-7 15:33
说到剪映顺便问一手   在剪映中如何批量调整音频的响度?    几千条音频 一条一条弄太麻烦了
我没有找到 ...

全部拖到时间线。全选就行。或者缩放后在时间线上框选。但是剪映没有压限功能哦,都是统一调整增减音量。
不过剪映好像输出的时候都是压限到-20db的,所以不调直接输出也不会爆音。

但是我也不高tts,不知道你这几千条是一定要分开还是合成一条也行

Pxhpanic 发表于 2024-2-8 11:47:49

seancai110 发表于 2024-2-7 20:00
全部拖到时间线。全选就行。或者缩放后在时间线上框选。但是剪映没有压限功能哦,都是统一调整增减音量。 ...

噢大概明白了谢谢
音频得分开否则会oom
页: [1]
查看完整版本: 这种问题在音乐领域怎么称呼?