MooreThreads/MooER 开源项目安装与配置指南

1. 项目基础介绍

MooreThreads/MooER 是一个开源的基于大型语言模型的语音识别和翻译项目。它能够实现自动语音识别(ASR)和自动语音翻译(AST),支持将语音转录为文本以及将语音翻译成其他语言。该项目使用了先进的深度学习技术,旨在提供端到端的语音处理解决方案。

主要编程语言:Python

2. 项目使用的关键技术和框架

  • 深度学习模型:项目采用了大型语言模型进行语音识别和翻译任务。
  • Moore Threads S4000 GPU:项目支持并优化了在Moore Threads S4000 GPU上的训练和推理。
  • MUSA Toolkit:针对Moore Threads S3000/S4000用户,项目使用了MUSA Toolkit rc2.1.0以实现高效的LLM推理。

3. 项目安装和配置的准备工作

在开始安装之前,请确保您的系统满足以下要求:

  • 操作系统:Linux
  • Python版本:3.8 或更高版本
  • 必需软件:git, python, ffmpeg, sox
  • 虚拟环境:推荐使用conda创建虚拟环境
  • GPU支持:推荐使用支持CUDA的GPU,对于Moore Threads S4000用户,需要安装MUSA Toolkit rc2.1.0

详细安装步骤

步骤 1:克隆项目

首先,使用git克隆项目仓库到本地:

git clone https://github.com/MooreThreads/MooER.git
cd MooER
步骤 2:创建虚拟环境(可选)

推荐使用conda创建一个Python虚拟环境,以避免依赖冲突:

conda create -n mooer python=3.8
conda activate mooer
步骤 3:安装依赖

更新系统包并安装所需的依赖:

apt update
apt install ffmpeg sox
pip install -r requirements.txt
步骤 4:配置GPU环境

对于Moore Threads S4000用户,可以使用Docker镜像来运行环境:

sudo docker run -it \
  --privileged \
  --name=torch_musa_release \
  --env MTHREADS_VISIBLE_DEVICES=all \
  -p 10010:10010 \
  --shm-size 80g \
  --ulimit memlock=-1 \
  mtspeech/mooer:v1.0-rc2.1.0-v1.1.0-qy2 \
  /bin/bash

如果您是NVIDIA用户,可以尝试使用CUDA 11.7的Docker镜像:

sudo docker run -it \
  --privileged \
  --gpus all \
  -p 10010:10010 \
  --shm-size 80g \
  --ulimit memlock=-1 \
  mtspeech/mooer:v1.0-cuda11.7-cudnn8 \
  /bin/bash

以上步骤完成后,您就可以开始使用MooreThreads/MooER项目进行开发了。请注意,根据项目的发展,安装和配置步骤可能会有所更新,请关注项目的官方文档以获取最新信息。

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐