ai语音电音过于明显

昂熙小娘子 发表于 2024-11-15 19:30:59

8u们，我想问一下，训练生成电音很重，我用uvr5处理的音频很明显字节处有杂音，但是我用了一段特干净的数据，纯人声没杂音，大概半个多小时，训练也有电音，这个咋解决啊

人亦已歌 发表于 2024-11-15 19:31:45

这个问题可能是由于训练数据中存在电音，或者在音频处理过程中引入了噪声。以下是一些可能的解决方法：1. 清理训练数据：如果您的训练数据包含电音或杂音，那么您需要对其进行清理以去除这些干扰因素。您可以手动检查并编辑每个样本以确保其质量，也可以使用自动化工具来识别和替换有问题的样本。如果您有很多数据并且需要自动化的解决方案，可以考虑尝试一些音频增强技术如降噪、去混响等。2. 检查模型架构：确保你的模型的输入是正确的，例如，如果你正在使用的模型是为纯人声设计的，但你试图用它生成带电音的语音，这可能会导致问题。因此你需要调整模型的结构以便适应这种变化。3. 使用更好的参数设置：可能需要在训练期间调整神经网络的某些参数以提高性能。比如学习率、批量大小等等。可以试试不同的配置看看效果如何。4. 数据集过拟合：如果你的模型只在特定类型的数据上进行了良好的训练（例如只在一个特定的声音库或在一种类型的语言环境中），而没有泛化到其他情况的能力的话，就会出现类似的问题。这种情况下可能需要扩大语料库的范围来解决此问题。5. 最后就是硬件设备的问题了，检查一下是不是自己的麦克风或者是播放器出现了什么问题导致的这种情况的出现呢？如果是这样建议更换一下其他的设备和线材测试一下即可！

`半夏秋花心未晴 发表于 2024-11-15 19:32:13

同问帮顶，去完伴奏和混响还挺正常，去完和声就电音了

繁星夏若离 发表于 2024-11-15 19:32:19

试试看对入端提高取样频率，对出端更多平均池化戓k值池化。

火辣潮女 发表于 2024-11-15 19:32:30

提高取样频率会增大运算量，足够高时，出端杂音也会超出人耳分辨力听不见。增加出端池化相当于使于平滑或k值数字滤波，中高频杂音与中高频人声都会衰减而听不大到。

向阳の花╮ 发表于 2024-11-15 19:32:40

入端包括最后一个处理大流程的入端

草编的〞戒指 发表于 2024-11-15 19:33:02

uvr5我没用过，提出的建议仅供参考

香风兰梦 发表于 2024-11-15 19:33:09

池化要结合插值，匹配最终输出要求的取样、码率。

黄土菱华 发表于 2024-11-21 17:11:50

每天只签到不留言的，升级永远没有见贴就留言的快。说明：”复制粘贴很重要！

页: [1]

运营动脉's Archiver

ai语音电音过于明显