草庐IT

【音频处理】python将两个单声道wav音频合成一个双声道wav音频_立体声感

attense 2023-05-15 原文

python将两个单声道wav音频合成一个双声道wav音频_立体声感


在以下内容中,若有任何错误和不足,欢迎读者进行指正,不尽感激!

环境相关

python==3.6.13
numpy==1.19.2
scipy==1.5.2
PyAudio==0.2.11
wave
time
……
缺啥补啥

编写目的

  • 在实验过程中,发现经常需要双声道的音频,但之前录制得到的音频都是单声道的,即便是通过pyaudio指定了录制双声道音频,但录制结果中左声道和右声道的信息是一样的 (这一点受限于硬件和代码,现在已经解决了这个问题,后续会进行更新)。
  • 现在我需要的是一个左声道和右声道的音频内容不同的双声道音频,故编写了此代码进行测试,在测试过程中,左声道使用的是语音“1”的内容,右声道使用的是语音“2”的内容,即读三个1或者三个2。
  • 得到的合成音频,能够听出左右声道具有不同的音频信息,我可以听出左边耳朵在朗读“1”,右边耳朵在朗读“2”。
  • 但目前的代码仍有一些缺陷,比如有一些固有限制:目前要求两个单声道音频的参数都相同(时间、采样频率、采样宽度,压缩格式等)
  • 目前采用的左右声道的音频都是基于同样的录音参数进行录制的,录音部分的代码也将在下面放出。

录音代码

在这个部分中,将展示我使用的录音代码,使用的录音设备是默认,经测试需要在电脑中进行设置,当前展示的是仅录制一个声道的音频的代码,即便修改了通道参数,两个声道的内容仍是一样的(非立体声效果)。该部分的代码编写参考于博客https://blog.csdn.net/weixin_45973679/article/details/121709190 的内容进行改写。

import wave
import time
from pyaudio import PyAudio, paInt16

framerate = 16000  # 采样率
num_samples = 2000  # 采样点
channels = 1  # 声道
sampwidth = 2  # 采样宽度2bytes

def save_wave(filepath, data):
    # 保存录音文件的函数
    wf = wave.open(filepath, 'wb')
    wf.setnchannels(channels)
    wf.setsampwidth(sampwidth)
    wf.setframerate(framerate)
    wf.writeframes(b''.join(data))
    wf.close()
 
 def record(filepath, record_time):
    # 录音函数
    # 其中,filepath是文件保存路径,需要把文件格式也写上(.wav);record_time是录音时间,单位为s;
    pa = PyAudio()
    stream = pa.open(format=paInt16, channels=channels,
                     rate=framerate, input=True, frames_per_buffer=num_samples)
    my_buf = []
    # count = 0
    t = time.time()
    print('正在录音...')

    while time.time() < t + record_time:  # 录音时间内
        string_audio_data = stream.read(num_samples)
        my_buf.append(string_audio_data)
    print('录音结束.')

    save_wave(filepath, my_buf)
    stream.close()
 
 if __name__ == '__main__':
    record('2channel_merge_channel1.wav', 5)  # 保存文件名为myrecord.wav, 录音时间为6s

若是在Jetson中进行操作的话,可以同时录制两个不同声道的音频信息,但使用以上代码是无法完美完成的,这部分的代码将在后续的工作中更新。

单通道音合成双通道音频代码

  • 这里附上由两个单通道的wav文件合成一个双通道wav文件的代码;
  • 在编写过程中,我读取一个双通道音频进行测试,查看其数据格式,并测试了拼接方法,让读取的单通道音频的数据通过组合与调整,得到双通道的格式;
  • 所使用的录音代码如上一节所示;
  • 经测试,由上述录音代码,分别录制音频内容不同的两段参数相同的音频(在录音代码中仅修改文件名即可,然后录制两次音频,说话内容不同)。经过合成后,能够得到左右耳内容不同的双声道音频。
  • 对代码内容进行了注释,帮助理解,若有错误和不足,欢迎读者进行指正

代码如下:

#!/usr/bin/env python3
# encoding: utf-8
"""
将两个单声道音频合成为一个双声道音频的测试
@author: shy
@contact: hy_shu@qq.com
@application:
@file: 2channel_merge.py
@time: 2022/6/21 15:10
"""

import scipy.io.wavfile as wavfile
import numpy as np
import wave

class merge_2channels():
    """
    用于将两个已经存在的单声道wav音频,合成一个双声道wav音频
    根据两个单声道wav音频的不同之处,能够生成左右声道内容不同的双声道wav文件
    目前还有一些限制,在后续的版本上会进行更新
    限制:目前要求两个单声道音频的参数都相同(时间、采样频率、采样宽度,压缩格式等)

    """

    def __init__(self, merge_framerate, merge_samples, merge_sampwidth=2, merge_channels=2):
        self.merge_framerate = merge_framerate # 采样率
        self.merge_samples = merge_samples # 采样点
        self.merge_sampwidth = merge_sampwidth # 采样宽度,默认2byte
        self.merge_channels = merge_channels # 声道数,因为是生成双声道音频所以默认2

    def save_file(self, filepath, data):
        """
        保存录音文件
        :param filepath: 用于保存的路径(str)
        :param data: 音频数据(2列的ndarray)
        :return:
        """
        wf = wave.open(filepath, 'wb') # 打开目标文件,wb表示以二进制写方式打开,只能写文件,如果文件不存在,创建该文件;如果文件已存在,则覆盖写
        wf.setnchannels(self.merge_channels) # 设置声道数
        wf.setsampwidth(self.merge_sampwidth) # 设置采样宽度
        wf.setframerate(self.merge_framerate) # 设置采样率
        wf.writeframes(data.tostring()) # 将data转换为二进制数据写入文件
        wf.close() # 关闭已打开的文件

    def merge(self, audio_left, audio_right, merge_audio):
        """
        基于两个单声道音频合成一个双声道音频
        :param audio_left: 左声道音频的路径(str)
        :param audio_right: 右声道音频的路径(str)
        :param merge_audio: 合成音频的路径(str)
        :return:
        """
        fs_left, data_left = wavfile.read(audio_left)  # 读取左声道音频数据
        fs_right, data_right = wavfile.read(audio_right)  # 读取右声道音频数据

        data = np.vstack([data_left, data_right])  # 组合左右声道
        data = data.T  # 转置(这里我参考了双声道音频读取得到的格式)
        self.save_file(merge_audio, data) # 保存

if __name__ == '__main__':
    a = merge_2channels(merge_framerate=16000, merge_samples=2000, merge_sampwidth=2) # 指定相关参数,目前要求单通道音频参数一致
    a.merge('2channel_merge_channel1.wav', '2channel_merge_channel2.wav', '2channel_class_merge.wav') # 合成

代码中如果有任何可以继续改进和完善的地方,望大家不吝赐教٩(*Ӧ)و!

有关【音频处理】python将两个单声道wav音频合成一个双声道wav音频_立体声感的更多相关文章

  1. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  2. ruby - 如何指定 Rack 处理程序 - 2

    Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

  3. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  4. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  5. ruby-on-rails - 渲染另一个 Controller 的 View - 2

    我想要做的是有2个不同的Controller,client和test_client。客户端Controller已经构建,我想创建一个test_clientController,我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集,然后呈现客户端Controller的索引View,以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>

  6. ruby-on-rails - 如何在 ruby​​ 中使用两个参数异步运行 exe? - 2

    exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby​​中使用两个参数异步运行exe吗?我已经尝试过ruby​​命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe,无需等待进程完成是否有任何ruby​​gems会支持我的问题? 最佳答案 您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除

  7. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

    如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

  8. ruby - 为什么 SecureRandom.uuid 创建一个唯一的字符串? - 2

    关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion为什么SecureRandom.uuid创建一个唯一的字符串?SecureRandom.uuid#=>"35cb4e30-54e1-49f9-b5ce-4134799eb2c0"SecureRandom.uuid方法创建的字符串从不重复?

  9. ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2

    我有一个正在构建的应用程序,我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是,在make_tires内部有一个错误,如果我为Tire尝试它,则没有用于创建或新建的activerecord方法。当我检查轮胎时,它没有这些方法。我该如何补救?错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发,它们都因相同的错误而失败。 最佳答案

  10. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

随机推荐