人声与背景音乐源分离

人声分离是将音频录音分离为各个源的任务。该存储库是音乐源分离的 PyTorch 实现。用户可以通过安装此存储库将自己喜欢的歌曲分成不同的来源。用户还可以训练自己的源分离系统。该存储库还可用于训练语音增强、乐器分离和任何分离系统。从github上下载，然后存放到指定文件夹下：/root/bytesep_data/train_scripts/musdb18。执行以上，可分离出人声，若效果不理想需要进行

查里王

1857人浏览 · 2023-11-09 21:49:32

查里王 · 2023-11-09 21:49:32 发布

一.人声分离项目说明

人声分离是将音频录音分离为各个源的任务。该存储库是音乐源分离的 PyTorch 实现。用户可以通过安装此存储库将自己喜欢的歌曲分成不同的来源。用户还可以训练自己的源分离系统。该存储库还可用于训练语音增强、乐器分离和任何分离系统。

2.1 环境配置

Python的版本必须用3.7,(尝试过更高的版本都会报错）

Python升级方法如下，把3.7.17版本的下载地址：

升级Python 到3.7

CentOS 7.X 升级 Python 3.8.X

2.2 安装配置

安装ffmpeg，参考：

Linux（Centos7）安装Ffmpeg-腾讯云开发者社区-腾讯云

pip install bytesep==0.1.1

下载依赖的人声伴奏配置

从github上下载，然后存放到指定文件夹下：/root/bytesep_data/train_scripts/musdb18

下载文件为：vocals-accompaniment,resunet_subbandtime.yaml

https://github.com/bytedance/music_source_separation/blob/master/scripts/4_train/musdb18/configs/vocals-accompaniment%2Cresunet_subbandtime.yaml

从zenodo上下载文件resunet143_subbtandtime_accompaniment_16.4dB_500k_steps_v2.pth

存放到目录：/root/bytesep_data 下

python -m bytesep separate \
    --source_type="vocals" \
    --audio_path="./resources/vocals_accompaniment_10s.mp3" \
    --output_path="separated_results/output.mp3"

用户还可以将多个音频文件放入一个目录中并将它们全部分开。

python -m bytesep separate \
    --source_type="vocals" \
    --audio_path="audios_directory" \
    --output_path="outputs_directory"

执行以上，可分离出人声，若效果不理想需要进行微调操作。

三.引荐来自字节开源项目

开源项目：https://github.com/bytedance/music_source_separation

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f