人语_草庐IT

单通道说话人语音分离——Conv-TasNet模型(ConvolutionalTime-domainaudioseparationNetwork)参考文献：《Conv-TasNet:SurpassingIdealTime-FrequencyMagnitudeMaskingforSpeechSeparation》1.背景在真实的声学环境中，鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性，人们已经提出了许多方法来解决这一问题。然而，语音分离的准确性，特别是对新演讲者，仍然不够。大多数以前的语音分离方法都是在混合信号的时频（T-F，或谱图