如何用Demucs完美分离人声和伴奏：新手完整教程

Demucs是一款基于深度学习的音频分离工具，能够帮助音乐爱好者、创作者和音频工程师轻松分离歌曲中的人声和伴奏。本文将为你提供一个简单易懂的完整教程，让你快速掌握使用Demucs进行人声和伴奏分离的方法。## Demucs简介：什么是音频分离技术？音频分离技术是一种能够将混合音频中的不同声源（如人声、鼓、贝斯等）分离开来的技术。Demucs作为一款先进的音乐源分离模型，采用了混合频谱和波形

包楚多

1544人浏览 · 2026-04-29 10:21:06

包楚多 · 2026-04-29 10:21:06 发布

如何用Demucs完美分离人声和伴奏：新手完整教程

【免费下载链接】demucs Code for the paper Hybrid Spectrogram and Waveform Source Separation 项目地址: https://gitcode.com/gh_mirrors/dem/demucs

Demucs是一款基于深度学习的音频分离工具，能够帮助音乐爱好者、创作者和音频工程师轻松分离歌曲中的人声和伴奏。本文将为你提供一个简单易懂的完整教程，让你快速掌握使用Demucs进行人声和伴奏分离的方法。

Demucs简介：什么是音频分离技术？

音频分离技术是一种能够将混合音频中的不同声源（如人声、鼓、贝斯等）分离开来的技术。Demucs作为一款先进的音乐源分离模型，采用了混合频谱和波形分离技术，能够实现高质量的音频分离效果。

Demucs的核心优势在于其采用的Hybrid Transformer架构，这种架构结合了卷积神经网络和Transformer的优点，能够在时间和频率两个维度上对音频进行精细处理。下面是Demucs的架构示意图：

准备工作：安装Demucs的详细步骤

在开始使用Demucs之前，我们需要先进行安装。Demucs支持Windows、macOS和Linux系统，下面分别介绍各系统的安装方法。

Windows系统安装步骤

首先安装Anaconda（Python 3.8或更高版本），可以从Anaconda官网下载。
启动Anaconda Prompt。

运行以下命令安装必要的依赖：

conda install -c conda-forge ffmpeg
python.exe -m pip install -U demucs SoundFile

macOS系统安装步骤

如果你还没有安装Anaconda，可以从Anaconda官网下载Python 3.8或更高版本的64位安装包。
打开Anaconda Prompt。

运行以下命令：

conda activate
pip3 install -U demucs
conda install ffmpeg -c conda-forge

Linux系统安装步骤

如果你的系统Python版本较旧（低于3.8），建议先安装Miniconda。

打开终端，运行以下命令：

conda activate
pip3 install -U demucs
conda install ffmpeg -c conda-forge

或者，如果你不想使用conda，可以直接运行：

pip3 install --user -U demucs
sudo apt-get install ffmpeg  # 对于Debian/Ubuntu系统

快速上手：使用Demucs分离人声和伴奏的基本命令

安装完成后，我们就可以开始使用Demucs进行音频分离了。最基本的命令如下：

demucs --two-stems=vocals PATH_TO_AUDIO_FILE

这个命令会将音频文件分离为人声（vocals）和伴奏（accompaniment）两个部分。其中，PATH_TO_AUDIO_FILE是你要处理的音频文件路径。

如果你的文件路径包含空格，记得用引号括起来，例如：

demucs --two-stems=vocals "我的音乐/最喜欢的歌曲.mp3"

分离后的文件会保存在separated/模型名称/歌曲名称文件夹中，其中会包含vocals.wav（人声）和accompaniment.wav（伴奏）两个文件。

高级技巧：提升分离质量的实用参数

Demucs提供了一些参数，可以帮助你获得更好的分离效果。以下是一些常用的高级参数：

选择不同的模型

Demucs提供了多种预训练模型，你可以使用-n参数来选择：

demucs -n htdemucs_ft --two-stems=vocals 音频文件.mp3

其中，htdemucs_ft是一个经过微调的模型，分离质量更高，但速度会慢一些。其他可用的模型包括htdemucs、hdemucs_mmi、mdx等。

输出为MP3格式

默认情况下，Demucs输出的是WAV格式文件。如果你想直接输出MP3格式，可以使用--mp3参数：

demucs --mp3 --two-stems=vocals 音频文件.wav

你还可以使用--mp3-bitrate参数来设置MP3的比特率，例如：

demucs --mp3 --mp3-bitrate 320 --two-stems=vocals 音频文件.wav

处理大文件或内存不足的情况

如果你的音频文件很大，或者你的电脑内存有限，可以使用--segment参数来分割音频进行处理：

demucs --segment 10 --two-stems=vocals 长音频文件.mp3

这里的10表示将音频分割成10秒的片段进行处理。

常见问题解决：解决Demucs使用过程中的疑难杂症

GPU加速问题

如果你有NVIDIA显卡，并且安装了CUDA，Demucs会自动使用GPU进行加速。如果遇到GPU内存不足的问题，可以尝试以下方法：

使用--segment参数减小分段大小
设置环境变量：set PYTORCH_NO_CUDA_MEMORY_CACHING=1（Windows）或export PYTORCH_NO_CUDA_MEMORY_CACHING=1（macOS/Linux）
如果以上方法都不行，可以强制使用CPU：demucs -d cpu --two-stems=vocals 音频文件.mp3

权限错误

在Windows系统上，如果遇到权限错误，可以尝试以管理员身份运行Anaconda Prompt。

MKL库错误

如果出现mkl_intel_thread.dll找不到的错误，可以尝试运行：

conda install -c defaults intel-openmp -f

总结：Demucs音频分离的最佳实践

Demucs是一款功能强大的音频分离工具，通过本文的教程，你应该已经掌握了使用Demucs分离人声和伴奏的基本方法。以下是一些最佳实践建议：

对于大多数用户，推荐使用htdemucs_ft模型，它在质量和速度之间取得了很好的平衡。
如果你的电脑配置较低，可以使用mdx_q或mdx_extra_q等量化模型，它们体积更小，运行速度更快。
处理多个文件时，可以使用批处理命令，例如在Windows的Anaconda Prompt中：
```
cd 音乐文件夹
for %i in (*.mp3) do (demucs --two-stems=vocals "%i")
```

希望这篇教程能帮助你轻松使用Demucs进行音频分离，为你的音乐创作和欣赏带来更多可能！如果你想了解更多关于Demucs的高级功能，可以参考官方文档：docs/official.md。

【免费下载链接】demucs Code for the paper Hybrid Spectrogram and Waveform Source Separation 项目地址: https://gitcode.com/gh_mirrors/dem/demucs