3天精通Spleeter模型训练：从数据准备到模型导出的完整指南

Spleeter是Deezer开发的一款开源音乐源分离工具，采用深度学习技术从混合音频中提取并分离出人声和其他乐器音轨，对于音乐制作、分析和研究领域具有重要意义。本指南将帮助你在3天内掌握Spleeter模型的训练流程，从数据准备到模型导出，轻松上手音乐源分离技术。## 认识Spleeter：强大的音乐源分离工具Spleeter是由Deezer开发的开源音乐源分离库，基于Python和Te

乔昊稳Oliver

990人浏览 · 2026-02-07 00:45:23

乔昊稳Oliver · 2026-02-07 00:45:23 发布

3天精通Spleeter模型训练：从数据准备到模型导出的完整指南

【免费下载链接】spleeter deezer/spleeter: Spleeter 是 Deezer 开发的一款开源音乐源分离工具，采用深度学习技术从混合音频中提取并分离出人声和其他乐器音轨，对于音乐制作、分析和研究领域具有重要意义。项目地址: https://gitcode.com/gh_mirrors/sp/spleeter

Spleeter是Deezer开发的一款开源音乐源分离工具，采用深度学习技术从混合音频中提取并分离出人声和其他乐器音轨，对于音乐制作、分析和研究领域具有重要意义。本指南将帮助你在3天内掌握Spleeter模型的训练流程，从数据准备到模型导出，轻松上手音乐源分离技术。

认识Spleeter：强大的音乐源分离工具

Spleeter是由Deezer开发的开源音乐源分离库，基于Python和Tensorflow构建，提供了预训练模型，可实现人声/伴奏分离（2stems）、人声/鼓/贝斯/其他分离（4stems）以及人声/鼓/贝斯/钢琴/其他分离（5stems）等多种分离模式。

Spleeter不仅分离效果出色，而且速度极快，在GPU上运行时，4stems模型的分离速度可达实时的100倍。它可以通过命令行直接使用，也可以作为Python库集成到自己的开发流程中，支持pip安装和Docker使用。

第1天：环境搭建与数据准备

快速安装Spleeter

首先需要安装ffmpeg和libsndfile依赖，然后通过pip安装Spleeter：

# 安装依赖
conda install -c conda-forge ffmpeg libsndfile
# 安装spleeter
pip install spleeter

⚠️ 注意：我们不再推荐使用conda安装spleeter。对于Apple M1芯片用户，可能存在TensorFlow兼容性问题，可以参考相关 workaround 解决。

准备训练数据集

Spleeter的训练需要准备包含孤立源的音频数据集。你可以使用musdb数据集，也可以准备自己的数据集。数据集需要包含混合音频和对应的分离源音频，并生成训练和验证CSV文件。

在项目中，测试文件tests/test_train.py提供了生成虚假训练数据集的方法，可以作为参考。生成的CSV文件应包含音频文件路径和对应的源标签。

第2天：模型训练详解

配置训练参数

Spleeter的训练配置文件位于configs/目录下，例如configs/2stems/base_config.json、configs/4stems/base_config.json和configs/5stems/base_config.json，分别对应不同的分离模式。

你可以根据需要修改配置文件中的参数，如训练迭代次数、批次大小、学习率等。主要的训练参数包括：

train_max_steps：训练的最大步数
train_csv：训练数据CSV文件路径
validation_csv：验证数据CSV文件路径
training_cache：训练缓存目录

执行训练命令

使用以下命令开始训练模型：

# 克隆仓库
git clone https://gitcode.com/gh_mirrors/sp/spleeter && cd spleeter
# 安装依赖
pip install poetry
poetry install
# 执行训练
poetry run python -m spleeter train -p configs/2stems/base_config.json -d /path/to/dataset --verbose

训练过程中，Spleeter会使用spleeter/main.py中的train函数，通过spleeter/dataset.py获取训练和验证数据集，并使用spleeter/model/init.py中的模型构建器进行模型训练。

第3天：模型评估与导出

评估模型性能

训练完成后，可以使用评估命令来评估模型的分离性能：

poetry run python -m spleeter evaluate -p configs/2stems/base_config.json -d /path/to/dataset

评估结果将反映模型在验证集上的表现，帮助你判断模型是否满足需求。

导出训练好的模型

训练好的模型会保存在指定的模型目录中，你可以使用Saver类将模型导出为可用于分离的格式：

saver = tf.compat.v1.train.Saver()
latest_checkpoint = tf.train.latest_checkpoint(model_directory)
saver.restore(sess, latest_checkpoint)
# 导出模型
saver.save(sess, export_path)

导出后的模型可以用于实际的音频分离任务，使用以下命令即可分离音频：

spleeter separate -p spleeter:2stems -o output audio_example.mp3

总结

通过本指南，你已经了解了Spleeter模型训练的完整流程，包括环境搭建、数据准备、模型训练、评估和导出。Spleeter作为一款强大的音乐源分离工具，为音乐制作和分析提供了便利。无论是专业音乐制作人还是音频爱好者，都可以通过Spleeter轻松实现音频源分离，开启音乐创作的新可能。

希望本指南能帮助你快速掌握Spleeter模型训练，如有任何问题，可以参考项目的README.md或查看相关文档获取更多信息。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

YOLOv11【第四章：巅峰前沿与融合篇·第13节】生物计算与神经形态硬件：Spike 脉冲神经网络替换 YOLOv11！

脑启社区

RCX多架构支持揭秘：ARM、x86、64位设备的兼容性解决方案

RCX作为Android平台上的Rclone客户端，通过创新的多架构支持技术，实现了对ARM、x86和64位设备的全面兼容。本文将深入剖析RCX如何突破硬件限制，让不同架构的Android设备都能享受高效的云存储管理体验。## 多架构支持的核心价值在Android设备碎片化严重的今天，处理器架构的多样性给开发者带来了巨大挑战。RCX通过精细化的架构适配，确保从低端手机到高端平板的各类设备都