ASR

安装kaldi

环境 操作系统建议使用Ubuntu,因为官方源里已经有编译好的一些依赖库,如ATLAS,安装不会遇到太多问题。 需要安装有git,subvers

使用thchs30数据集

1.下载数据集 Kaldi中文语音识别公共数据集有: 1.aishell:AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kald

使用aishell数据集

1.安装依赖 安装train_lm.sh: cd tools ./extras/install_kaldi_lm.sh 2.获取数据集 和thchs30类似,参照egs/aishell/README.txt,手动下载

使用cvte预训练模型

cvte开放了已经训练好的模型,不用再花费大量时间和算力去训练,但注意cvte没有开源数据集和模型配置 获取模型 从 http://kaldi-asr.org/models/m2 下载 0002_cvte_chain_model.tar.gz(3.5G) 解压缩到kaldi/