草庐IT

基于Python+WaveNet+CTC+Tensorflow智能语音识别与方言分类—深度学习算法应用(含全部工程源码)

目录前言总体设计系统整体结构图系统流程图运行环境Python环境Tensorflow环境模块实现1.方言分类数据下载及预处理模型构建模型训练及保存2.语音识别数据预处理模型构建模型训练及保存3.模型测试功能选择界面语言识别功能实现界面方言分类功能实现界面系统测试1.训练准确率2.测试效果3.模型应用工程源代码下载其它资料下载前言本项目利用语音文件和方言标注文件,提取语音的梅尔倒谱系数特征,并对这些特征进行归一化处理。在基于标注文件的指导下,构建了一个字典来管理数据。接着,我们选择WaveNet机器学习模型进行训练,并对模型的输出进行softmax处理。最终,经过训练后的模型将被保存以备后续使用