这一篇内容将围绕语音识别与合成方向,继续为大家带来相关技术解析。“风物长宜放眼量”。面向人机交互更加自然流畅的未来,智能语音技术进展如何?该走向何方?以下内容根据讯飞研究院杰出科学家潘嘉在NCMMSC2022上的主题演讲《科大讯飞语音技术前沿进展》整理。技术专业度:⭐⭐⭐⭐⭐目录语音识别1、主流框架均为自回归端到端建模2、提出基于文本语音统一空间表达的非自回归ASR框架3、进一步提出多元语义评价的多任务学习框架语音合成1、提出SMART-TTS2、虚拟音色生成语音识别主流框架均为自回归端到端建模当前,基于自回归方式的端到端建模已经成为语音识别的主流框架。主要包含Attention-basedE