草庐IT

finetune

全部标签

基于kaldi的语音识别:chain模型的finetune通用步骤

前记:先说下模型训练的背景。正如一般的机器学习的模型训练那样,首先会用较大的数据集训练生成一个较大的模型,然后在这个模型基础上进行调优,也就是finetune。 我这边基于kaldi的模型训练也是采用这个的思路。Kaldi下面通常是用GMM+Chain的形式进行声学模型训练,然后还要结合语言模型进行训练和解码(这点同端对端的方案是不一样的)。GMM用来做语音序列同文本的对齐,然后再做chain模型的训练,得到声学模型。这可以看作是预训练(pre-training)。Kaldi提供的chain模型训练脚本可以参考egs/libspeech/s5/local/chain/run_tdnn.sh或者

基于kaldi的语音识别:chain模型的finetune通用步骤

前记:先说下模型训练的背景。正如一般的机器学习的模型训练那样,首先会用较大的数据集训练生成一个较大的模型,然后在这个模型基础上进行调优,也就是finetune。 我这边基于kaldi的模型训练也是采用这个的思路。Kaldi下面通常是用GMM+Chain的形式进行声学模型训练,然后还要结合语言模型进行训练和解码(这点同端对端的方案是不一样的)。GMM用来做语音序列同文本的对齐,然后再做chain模型的训练,得到声学模型。这可以看作是预训练(pre-training)。Kaldi提供的chain模型训练脚本可以参考egs/libspeech/s5/local/chain/run_tdnn.sh或者
12