kaldi

"语音识别工具"

Posted by zwt on October 22, 2020

安装

1
2
3
4
5
6
7
8
9
git上下载https://github.com/kaldi-asr/kaldi
cd kaldi/tools
extras/check_dependencies.sh
make -j 8
进入src目录
cpu版本   ./configure --use-cuda=no
gpu版本   ./configure  --cudatk-dir=DIR      CUDA toolkit directory
make depend -j
make -j

测试

测试yesno任务:

1
2
kaldi/egs/yesno/s5
./run.sh

训练thchs30: 数据下载:

1
在 egs/thchs30/s5 建立 thchs30-openslr 文件夹,然后把三个文件解压在了该文件夹下

修改cmd.sh脚本,把原脚本注释掉,修改为本地运行:

1
2
3
4
export train_cmd=run.pl
export decode_cmd="run.pl --mem 4G"
export mkgraph_cmd="run.pl --mem 8G"
export cuda_cmd="run.pl --gpu 1"

修改run.sh:

1
2
3
4
n=8      #parallel jobs
#corpus and trans directory
#thchs=/nfs/public/materials/data/thchs30-openslr
thchs=/home/mike/src/kaldi/egs/thchs30/s5/thchs30-openslr

训练:

1
run.sh

结果查看:

1
/exp/tri4b_dnn/decode_test_word/scoring_kaldi$ cat best_wer

参考

  1. kaldi安装测试