【音频处理】python将两个单声道wav音频合成一个双声道wav音频_立体声感

attense 2023-05-15 原文

python将两个单声道wav音频合成一个双声道wav音频_立体声感

在以下内容中，若有任何错误和不足，欢迎读者进行指正，不尽感激！

环境相关

python==3.6.13
numpy==1.19.2
scipy==1.5.2
PyAudio==0.2.11
wave
time
……
缺啥补啥

编写目的

在实验过程中，发现经常需要双声道的音频，但之前录制得到的音频都是单声道的，即便是通过pyaudio指定了录制双声道音频，但录制结果中左声道和右声道的信息是一样的（这一点受限于硬件和代码，现在已经解决了这个问题，后续会进行更新）。
现在我需要的是一个左声道和右声道的音频内容不同的双声道音频，故编写了此代码进行测试，在测试过程中，左声道使用的是语音“1”的内容，右声道使用的是语音“2”的内容，即读三个1或者三个2。
得到的合成音频，能够听出左右声道具有不同的音频信息，我可以听出左边耳朵在朗读“1”，右边耳朵在朗读“2”。
但目前的代码仍有一些缺陷，比如有一些固有限制：目前要求两个单声道音频的参数都相同（时间、采样频率、采样宽度，压缩格式等）
目前采用的左右声道的音频都是基于同样的录音参数进行录制的，录音部分的代码也将在下面放出。

录音代码

在这个部分中，将展示我使用的录音代码，使用的录音设备是默认，经测试需要在电脑中进行设置，当前展示的是仅录制一个声道的音频的代码，即便修改了通道参数，两个声道的内容仍是一样的（非立体声效果）。该部分的代码编写参考于博客https://blog.csdn.net/weixin_45973679/article/details/121709190 的内容进行改写。

import wave
import time
from pyaudio import PyAudio, paInt16

framerate = 16000  # 采样率
num_samples = 2000  # 采样点
channels = 1  # 声道
sampwidth = 2  # 采样宽度2bytes

def save_wave(filepath, data):
    # 保存录音文件的函数
    wf = wave.open(filepath, 'wb')
    wf.setnchannels(channels)
    wf.setsampwidth(sampwidth)
    wf.setframerate(framerate)
    wf.writeframes(b''.join(data))
    wf.close()
 
 def record(filepath, record_time):
    # 录音函数
    # 其中，filepath是文件保存路径，需要把文件格式也写上（.wav）；record_time是录音时间，单位为s；
    pa = PyAudio()
    stream = pa.open(format=paInt16, channels=channels,
                     rate=framerate, input=True, frames_per_buffer=num_samples)
    my_buf = []
    # count = 0
    t = time.time()
    print('正在录音...')

    while time.time() < t + record_time:  # 录音时间内
        string_audio_data = stream.read(num_samples)
        my_buf.append(string_audio_data)
    print('录音结束.')

    save_wave(filepath, my_buf)
    stream.close()
 
 if __name__ == '__main__':
    record('2channel_merge_channel1.wav', 5)  # 保存文件名为myrecord.wav， 录音时间为6s

若是在Jetson中进行操作的话，可以同时录制两个不同声道的音频信息，但使用以上代码是无法完美完成的，这部分的代码将在后续的工作中更新。

单通道音合成双通道音频代码

这里附上由两个单通道的wav文件合成一个双通道wav文件的代码；
在编写过程中，我读取一个双通道音频进行测试，查看其数据格式，并测试了拼接方法，让读取的单通道音频的数据通过组合与调整，得到双通道的格式；
所使用的录音代码如上一节所示；
经测试，由上述录音代码，分别录制音频内容不同的两段参数相同的音频（在录音代码中仅修改文件名即可，然后录制两次音频，说话内容不同）。经过合成后，能够得到左右耳内容不同的双声道音频。
对代码内容进行了注释，帮助理解，若有错误和不足，欢迎读者进行指正。

代码如下：

#!/usr/bin/env python3
# encoding: utf-8
"""
将两个单声道音频合成为一个双声道音频的测试
@author: shy
@contact: hy_shu@qq.com
@application:
@file: 2channel_merge.py
@time: 2022/6/21 15:10
"""

import scipy.io.wavfile as wavfile
import numpy as np
import wave

class merge_2channels():
    """
    用于将两个已经存在的单声道wav音频，合成一个双声道wav音频
    根据两个单声道wav音频的不同之处，能够生成左右声道内容不同的双声道wav文件
    目前还有一些限制，在后续的版本上会进行更新
    限制：目前要求两个单声道音频的参数都相同（时间、采样频率、采样宽度，压缩格式等）

    """

    def __init__(self, merge_framerate, merge_samples, merge_sampwidth=2, merge_channels=2):
        self.merge_framerate = merge_framerate # 采样率
        self.merge_samples = merge_samples # 采样点
        self.merge_sampwidth = merge_sampwidth # 采样宽度，默认2byte
        self.merge_channels = merge_channels # 声道数，因为是生成双声道音频所以默认2

    def save_file(self, filepath, data):
        """
        保存录音文件
        :param filepath: 用于保存的路径(str)
        :param data: 音频数据(2列的ndarray)
        :return:
        """
        wf = wave.open(filepath, 'wb') # 打开目标文件，wb表示以二进制写方式打开，只能写文件，如果文件不存在，创建该文件；如果文件已存在，则覆盖写
        wf.setnchannels(self.merge_channels) # 设置声道数
        wf.setsampwidth(self.merge_sampwidth) # 设置采样宽度
        wf.setframerate(self.merge_framerate) # 设置采样率
        wf.writeframes(data.tostring()) # 将data转换为二进制数据写入文件
        wf.close() # 关闭已打开的文件

    def merge(self, audio_left, audio_right, merge_audio):
        """
        基于两个单声道音频合成一个双声道音频
        :param audio_left: 左声道音频的路径(str)
        :param audio_right: 右声道音频的路径(str)
        :param merge_audio: 合成音频的路径(str)
        :return:
        """
        fs_left, data_left = wavfile.read(audio_left)  # 读取左声道音频数据
        fs_right, data_right = wavfile.read(audio_right)  # 读取右声道音频数据

        data = np.vstack([data_left, data_right])  # 组合左右声道
        data = data.T  # 转置（这里我参考了双声道音频读取得到的格式）
        self.save_file(merge_audio, data) # 保存

if __name__ == '__main__':
    a = merge_2channels(merge_framerate=16000, merge_samples=2000, merge_sampwidth=2) # 指定相关参数，目前要求单通道音频参数一致
    a.merge('2channel_merge_channel1.wav', '2channel_merge_channel2.wav', '2channel_class_merge.wav') # 合成

代码中如果有任何可以继续改进和完善的地方，望大家不吝赐教٩(*Ӧ)و！

声道 wav span class token 音视频音频

有关【音频处理】python将两个单声道wav音频合成一个双声道wav音频_立体声感的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby - 如何指定 Rack 处理程序 - 2
Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时，rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack
ruby - 使用 Vim Rails，您可以创建一个新的迁移文件并一次性打开它吗？ - 2
使用带有Rails插件的vim，您可以创建一个迁移文件，然后一次性打开该文件吗？textmate也可以这样吗？最佳答案你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件，这正是您想要的。我不能代表textmate。关于ruby-使用VimRails，您可以创建一个新的迁移文件并一次性打开它吗？，我们在StackOverflow上找到一个类似的问题： https://sta
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby-on-rails - 渲染另一个 Controller 的 View - 2
我想要做的是有2个不同的Controller，client和test_client。客户端Controller已经构建，我想创建一个test_clientController，我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集，然后呈现客户端Controller的索引View，以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>
ruby-on-rails - 如何在 ruby 中使用两个参数异步运行 exe？ - 2
exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby中使用两个参数异步运行exe吗？我已经尝试过ruby命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe，无需等待进程完成是否有任何rubygems会支持我的问题？最佳答案您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除
ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象，为什么它会起作用？ - 2
如果您尝试在Ruby中的nil对象上调用方法，则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而，有一个tryRails中的方法，如果它被发送到一个nil对象，它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常？最佳答案像Ruby中的所有其他对象
ruby - 为什么 SecureRandom.uuid 创建一个唯一的字符串？ - 2
关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗？通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion为什么SecureRandom.uuid创建一个唯一的字符串？SecureRandom.uuid#=>"35cb4e30-54e1-49f9-b5ce-4134799eb2c0"SecureRandom.uuid方法创建的字符串从不重复？
ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2
我有一个正在构建的应用程序，我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是，在make_tires内部有一个错误，如果我为Tire尝试它，则没有用于创建或新建的activerecord方法。当我检查轮胎时，它没有这些方法。我该如何补救？错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发，它们都因相同的错误而失败。最佳答案
ruby - 用 Ruby 编写一个简单的网络服务器 - 2
我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不，不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本，提供另一个脚本，它将在其标准输入上获取请求，并在其标准输出上返回完整的响应。到目前为止一切顺利，但事实证明这真的很脆弱，因为它在第二个请求上中断并出现错误:/usr/b