博客
关于我
【语音信号处理】之 Kaldi ToolKit 和VoiceBox
阅读量:872 次
发布时间:2019-03-25

本文共 1643 字,大约阅读时间需要 5 分钟。

Ubuntu上安装Kaldi Toolkit和VoiceBox工具箱的详细指南

1. 安装Kaldi Toolkit

首先,正确安装Kaldi Toolkit是进行音频处理开发的基础。按照Kaldi官方文档,在Ubuntu系统上安装工具箱。

安装Git

确保你已经正确安装了Git软件,可以通过以下命令进行验证:

git --version

如果 Git 已经安装,可以继续下一步。如果尚未安装 Git,可以运行以下命令:

sudo apt install git

验证 Git 版本:

git --version

此时 Git 版本可能会显示 2.7.4 或更高版本。

配置Git

设置 Git 用户信息:

git config --global user.name “你的名字”git config --global user.email “你的邮箱”,例如:zhaodpx@163.com

检查配置信息:

git config --list

创建新的仓库:

git init

2. 安装Kaldi Toolkit

引导安装Kaldi Toolkit的步骤如下:

克隆仓库

从GitHub克隆 Kaldi 的源代码仓库:

git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream

进入工具目录并执行编译命令:

cd kaldi/tools/make

回到源码目录继续安装:

cd ../src/./configuremake

注意:在编译过程中可能会遇到依赖项安装要求,如 zlib、automake、autoconf、sox、gfortran、libtool 和 subversion。必要时运行以下命令安装:

sudo apt-get install zlib1g-dev automake autoconf sox gfortran libtool subversion

3. 安装VoiceBox

VoiceBox 是一个基于 MATLAB 的语音处理工具箱,安装步骤如下:

克隆或解压仓库

从GitHub克隆 VoiceBox 仓库或解压下载的 zip 文件,建议放在合适的文件夹(例如 C:\sap-voicebox)下。

添加 paths 到 MATLAB 中

启动 MATLAB 后:

  • 点击菜单栏中的 “File” > “Set Path”。
  • 点击 “Add Folder” 并浏览到路径 C:\sap-voicebox\voicebox。
  • 点击 “Select Folder” 然后 “Save”。
  • 配置 MATLAB 工作环境

    可以通过编辑 v_voicebox.m 文件或设置环境变量 VOICEBOX 来自定义配置参数:

    >> help voicebox

    运行此命令可以查看支持的所有功能和依赖项。

    选用性配置

    1. 可选:查看并安装 SIL 的 IPA 字体,建议将路径添加到 MATLAB 工作空间。
    2. 可选:将 SHORTEN 程序添加到所需位置,或修改 v_voicebox.m 中的路径指引。
    3. 4. 共享文件夹

      在 Ubuntu 系统中实现跨设备文件共享:

      安装 NFS 服务器

      运行以下命令安装 NFS 命令:

      sudo apt install nfs-kernel-servers

      挂载网络文件夹

      将远程文件夹(如 192.168.1.152:/home/zhuguili/mnt)挂载到本地:

      sudo mount -t nfs -o nolock 192.168.1.152:/home/zhuguili/mnt ~/tmp

      此时本地的 ~/tmp 文件夹即可访问远程共享文件夹。

      总结

      通过以上步骤,你已经成功安装了 Kaldi Toolkit 和 VoiceBox 工具箱,并实现了文件共享功能。这套工具将为你提供强大的语音处理开发能力,助力你的项目成功。

    转载地址:http://htiyk.baihongyu.com/

    你可能感兴趣的文章
    Perl6 必应抓取(1):测试版代码
    查看>>
    perl学习之内置变量
    查看>>
    perl正则表达式中的常用模式
    查看>>
    Perl的基本語法
    查看>>
    perl输出中文有乱码
    查看>>
    Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 大数据ssh权限问题 hadoop起不来 hadoopssh错
    查看>>
    PermissionError:Python 中的 [Errno 13]
    查看>>
    PermissionError:[Errno 13] 权限被拒绝:‘/manage.py‘
    查看>>
    Permutation
    查看>>
    return torch._C._broadcast_coalesced(tensors, devices, buffer_size)RuntimeError: NCCL Error 2:unhand
    查看>>
    perspective意思_2020年12月英语四级词汇讲解丨考点归纳:perspective
    查看>>
    PE启动盘和U启动盘(第三十六课)
    查看>>
    PE文件,节头有感IMAGE_SECTION_HEADER
    查看>>
    PE查找文件偏移地址
    查看>>
    PE知识复习之PE的导入表
    查看>>
    pfsense关闭nat
    查看>>
    PFX(Parallel Framework) and Traditional Multithreading
    查看>>
    PGOS:今天动手给电脑装青苹果Win7 X64位系统
    查看>>
    pgpool-II3.1 的内存泄漏(一)
    查看>>
    PgSQL · 特性分析 · PG主备流复制机制
    查看>>