草庐IT

FastSpeech2

全部标签

FastSpeech2——TTS论文阅读

笔记地址:https://flowus.cn/share/1683b50b-1469-4d57-bef0-7631d39ac8f0【FlowUs息流】FastSpeech2论文地址:lFastSpeech2:FastandHigh-QualityEnd-to-EndTexttoSpeechhttps://arxiv.org/abs/2006.04558Abstract:tacotron→fastspeech,引入knowledgedistillation,缓解TTS中one-to-manyproblem。问题:teacher-studentdistillationpipeline1)复杂速度慢

fastspeech2复现github项目--模型构建

在完成fastspeech论文学习后,对github上一个复现的仓库进行学习,帮助理解算法实现过程中的一些细节;所选择的仓库复现仓库是基于pytorch实现,链接为https://github.com/ming024/FastSpeech2。该仓库是基于https://github.com/xcmyz/FastSpeech中的FastSpeech复现代码完成的,很多代码基本一致。作者前期已对该FastSpeech复现仓库进行注释分析,感兴趣的读者可见此专栏。通过论文可知,FastSpeech2模型整体架构与FastSpeech基本一致,只是除了DurationPredicator外,还增加了P