单通道说话人语音分离——Conv-TasNet模型(ConvolutionalTime-domainaudioseparationNetwork)参考文献:《Conv-TasNet:SurpassingIdealTime-FrequencyMagnitudeMaskingforSpeechSeparation》1.背景 在真实的声学环境中,鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性,人们已经提出了许多方法来解决这一问题。然而,语音分离的准确性,特别是对新演讲者,仍然不够。 大多数以前的语音分离方法都是在混合信号的时频(T-F,或谱图