finetune_草庐IT

基于kaldi的语音识别：chain模型的finetune通用步骤

前记：先说下模型训练的背景。正如一般的机器学习的模型训练那样，首先会用较大的数据集训练生成一个较大的模型，然后在这个模型基础上进行调优，也就是finetune。我这边基于kaldi的模型训练也是采用这个的思路。Kaldi下面通常是用GMM+Chain的形式进行声学模型训练，然后还要结合语言模型进行训练和解码（这点同端对端的方案是不一样的）。GMM用来做语音序列同文本的对齐，然后再做chain模型的训练，得到声学模型。这可以看作是预训练（pre-training）。Kaldi提供的chain模型训练脚本可以参考egs/libspeech/s5/local/chain/run_tdnn.sh或者

基于kaldi的语音识别：chain模型的finetune通用步骤