VALL-E是一款由微软推出的ai声音生成工具,与一般ai声音生成工具不同的是VALL-E可以模仿说话者的情绪和语气来进行语音,显得更加智能有趣。VALL-E官网VALL-E(valle-demo.github.io)VALL-E介绍微软最近发布了一款名为VALL-E的人工智能工具,只需3秒音频即可模仿人说话。该工具经过60000小时英语语音数据的训练,并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。康奈尔大学的一篇论文使用VALL-E合成了几种声音,大家可以在GitHub上聆听这些AI合成的音频