草庐IT

speexdsp库实现音频3A算法,speexdsp库编译,C/C++

架相 2023-04-15 原文

目录

speex是音频编解码库,speexdsp是附加的音频DSP库,是音频降噪库,也有回声抑制和自动增益控制功能,即通常说的音频3A算法
现在音频编解码大部分都是使用opus库,很少使用speex进行音频编解码,但还是会使用speexdsp库的3A算法对音频数据进行处理。
本例是在ubuntu环境下,C/C++语言,使用Qt进行测试。

speexdsp库编译

源码下载:https://github.com/xiph/speexdsp/tags
我下载的版本:speexdsp-SpeexDSP-1.2.1.zip,解压缩。
编译步骤:

cd speexdsp-SpeexDSP-1.2.1/
./autogen.sh
#./autogen.sh: 11: autoreconf: not found报错,安装依赖
sudo apt-get install -y autoconf automake libtool
./configure --prefix=${BUILD_LIBS} --disable-oggtest
make
make install

在家目录的build_libs/文件夹下生成include头文件,和libspeexdsp.a静态库,libspeexdsp.so动态库。

使用speexdsp做音频去噪声demo

在Qt环境下测试,使用wav文件作为音频输入,把处理后的音频数据输出到本地wav文件,回声消除使用在语音通话场景,本例只给出接口样例。
把编译好的include和lib文件夹拷贝到过程目录下,pro文件添加如下内容:

INCLUDEPATH += $$PWD/include
LIBS += -L$$PWD/lib -lspeexdsp -ldl

chwRtcAec.h

#ifndef chwAUDIOPROC_chwRtcAec_H_
#define chwAUDIOPROC_chwRtcAec_H_
#include <stdint.h>
#include <stdlib.h>
typedef struct{
	void *session;
	void (*init)(void* session, int32_t sampleRate, int32_t pchannel,int32_t pframeSize,int32_t echopath);
	void (*closeAec)(void* session);

	void (*echoCapture)(void* session,short *rec, short *out);
	void (*preprocessRun)(void* session,short *pcm);
	void (*echoStateReset)(void* session);
	void (*echoPlayback)(void* session,short *play);
	void (*echoCancellation)(void* session,const short *rec, const short *play,
			short *out);
}chwRtcAec;

#define chw_delete(a) {if( (a)) {delete (a); (a) = NULL;}}
#define chw_deleteA(a) {if( (a)) {delete[] (a); (a) = NULL;}}
#define chw_free(a) {if( (a)) {free((a)); (a) = NULL;}}

#ifdef __cplusplus
extern "C"{
#endif
void chw_rtcaec_init(void* context, int32_t sampleRate, int32_t pchannel,int32_t pframeSize,int32_t echopath);
void chw_rtcaec_preprocess_run(void* context,short *pcm);
void chw_create_rtcaec(chwRtcAec* aec);
void chw_destroy_rtcaec(chwRtcAec* aec);
#ifdef __cplusplus
}
#endif
#endif /* chwAUDIOPROC_chwAECSPEEX_H_ */

chwRtcAec.c

#include "chwRtcAec.h"
#include <speex/speex_echo.h>
#include <speex/speex_preprocess.h>
#include <stdio.h>
#include <string.h>
typedef struct chwRtcAec{
	int32_t channel;
	int32_t frameSize;
	int32_t sampleRate;
	int32_t echoPath;
	SpeexEchoState *state;
	SpeexPreprocessState *preprocState;

}chwRtcAecContext;
///m_aec->session,16000,1,320,10
void chw_rtcaec_init(void* context, int32_t sampleRate, int32_t pchannel,int32_t pframeSize,int32_t echopath)
{
    if(context==NULL) return;
    chwRtcAecContext* aec=(chwRtcAecContext*)context;
    aec->frameSize = pframeSize;
    aec->sampleRate = sampleRate;
    aec->channel = pchannel;
    aec->echoPath=echopath;
    int32_t frame_size = aec->frameSize;//(aec->frameSizeInMS * aec->sampleRate * 1.0) / 1000;
    int32_t filter_length = aec->frameSize * aec->echoPath;//20;//30;//aec->echoPath;//(aec->frameSizeInMS * aec->sampleRate * 1.0) / 1000;

    /** 创建一个新的多通道回波取消器状态
     * @param frame_size 一次要处理的样本数(应对应10-20 ms)
     * @param filter_length 要取消的回波样本数(一般应对应100-500 ms)
     * @param aec->channel 麦克风通道数
     * @param aec->channel 扬声器通道数
     * @return 新创建的回波取消器状态
     */
    if(!aec->state) aec->state = speex_echo_state_init_mc(frame_size, filter_length, aec->channel,aec->channel);
    //frame_size *= 2; // length read each time

    /** 将创建一个新的预处理状态。您必须为每个已处理的通道创建一个状态。
     * @param frame_size 一次要处理的样品数(应对应10-20 ms)。必须为:与用于剩余回声消除的回波消除器的值相同。
     * @param sampling_rate 用于输入的采样率。
     * @return 返回新创建的预处理器状态
    */
    if(!aec->preprocState) aec->preprocState = speex_preprocess_state_init(frame_size, aec->sampleRate);

    speex_echo_ctl(aec->state, SPEEX_ECHO_SET_SAMPLING_RATE, &aec->sampleRate);//设置采样率
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_ECHO_STATE,aec->state);//设置相应的回波消除器状态,以便可进行残余回波抑制(无残余回波抑制时为NULL)
    int32_t i = 1;
    //speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_VAD, &i);
    int32_t noiseSuppress = -25;
    i = 1;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_DENOISE,	&i);//设置预处理器去噪状态
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_NOISE_SUPPRESS,	&noiseSuppress);//设置噪声的最大衰减,单位为dB(负数)
    i=0;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_AGC, &i);//设置预处理器自动增益控制状态
    i=sampleRate;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_AGC_LEVEL, &i);//设置预处理器自动增益控制级别(浮动)
    i=0;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_DEREVERB, &i);//设置预处理器dereverb状态
    float f=.0;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_DEREVERB_DECAY, &f);//设置预处理器dereverb decay
    f=.0;
    speex_preprocess_ctl(aec->preprocState, SPEEX_PREPROCESS_SET_DEREVERB_LEVEL, &f);//设置EverB级别的预处理器
}

void chw_rtcaec_close(void* context){
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    if(aec->state) speex_echo_state_destroy(aec->state);//销毁回声消除状态
    if(aec->preprocState) speex_preprocess_state_destroy(aec->preprocState);//销毁预处理器状态
	aec->state = NULL;
	aec->preprocState = NULL;
}

void chw_rtcaec_echo_capture(void* context,short *rec, short *out) {
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    /** 使用内部回放缓冲区执行回声取消,这会延迟两帧
     * 来解释大多数声卡引入的延迟(但它可能是关闭的!)
     * @param aec->state 回声消除器状态
     * @param rec 麦克风信号(近端+远端回声)
     * @param out 返回去除回声的近端信号
    */
	if(aec->state) speex_echo_capture(aec->state, rec, out);
}

void chw_rtcaec_preprocess_run(void* context,short *pcm)
{
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    /** 对帧进行预处理
     * @param aec->preprocState 预处理器状态
     * @param Pcm 音频样本向量(进和出)。必须与在speex_preprocess_state_init()中指定的大小相同。
     * @return 语音业务的Bool值(1表示语音,0表示噪音/静音),仅当VAD打开时使用。
    */
	if(aec->preprocState) speex_preprocess_run(aec->preprocState, pcm);
}

void chw_rtcaec_echo_state_reset(void* context) {
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    /** 将回声取消器重置到其原始状态
     * @param aec->state 回声消除状态
     */
	if(aec->state) speex_echo_state_reset(aec->state);
}
void chw_rtcaec_echo_playback(void* context,short *play) {
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    /** 让回声取消器知道一个帧刚刚排队到声卡上
     * @param aec->state 回声消除状态
     * @param play 信号播放到扬声器(从远端接收)
    */
	if(aec->state) speex_echo_playback(aec->state, play);
}
void chw_rtcaec_echo_cancellation(void* context,const short *rec, const short *play,
		short *out) {
	if(context==NULL) return;
	chwRtcAecContext* aec=(chwRtcAecContext*)context;
    /** 根据发送到扬声器的音频执行回声取消帧(没有添加延迟以此形式播放)
     * @param aec->state 回声消除状态
     * @param rec 来至麦克风的信号(近端+远端回声)
     * @param play 信号播放到扬声器(从远端接收)
     * @param out 返回消除回声的近端信号
     */
	if(aec->state) speex_echo_cancellation(aec->state, rec, play, out);
}

void chw_create_rtcaec(chwRtcAec* aec){
	if(aec==NULL) return;
	aec->session=(chwRtcAecContext*)calloc(sizeof(chwRtcAecContext),1);
	aec->init=chw_rtcaec_init;
	aec->closeAec=chw_rtcaec_close;
	aec->echoCancellation=chw_rtcaec_echo_cancellation;
	aec->echoCapture=chw_rtcaec_echo_capture;
	aec->echoPlayback=chw_rtcaec_echo_playback;
	aec->echoStateReset=chw_rtcaec_echo_state_reset;
	aec->preprocessRun=chw_rtcaec_preprocess_run;
}
void chw_destroy_rtcaec(chwRtcAec* aec){
	if(aec==NULL) return;

	chw_rtcaec_close((chwRtcAecContext*)aec->session);
	chw_free(aec->session);
}


qt调用示例:

#include "spxmainwindow.h"
#include "ui_spxmainwindow.h"

#include <QFile>
#define HEADLEN 44
#define SAMPLE_RATE   (48000)
#define SAMPLES_PER_FRAME  (1024)
#define FRAME_SIZE   (SAMPLES_PER_FRAME * 1000/ SAMPLE_RATE)
#define FRAME_BYTES  (SAMPLES_PER_FRAME)

spxMainWindow::spxMainWindow(QWidget *parent)
    : QMainWindow(parent)
    , ui(new Ui::spxMainWindow)
{
    ui->setupUi(this);

    pcm=new short[4096/2];
    m_aec = NULL;
    m_aec=(chwRtcAec*)calloc(sizeof(chwRtcAec),1);
    chw_create_rtcaec(m_aec);
    chw_rtcaec_init(m_aec->session,44100,1,1024,10);//注意传参的采样率、帧大小、通道数一定要和采集时一致

    dealAudio();
}

spxMainWindow::~spxMainWindow()
{
    chw_destroy_rtcaec(m_aec);
    chw_free(m_aec);
    chw_deleteA(pcm);
    delete ui;
}
//消除噪声处理,以wav文件为例
void spxMainWindow::dealAudio()
{
    size_t len = 0;
    QFile inFile, outFile;
    inFile.setFileName("./test.wav");
    outFile.setFileName("./outtest.wav");

    char headBuf[HEADLEN];
    char dataBuf[FRAME_BYTES * 2];

    QByteArray readBuf;
    if(inFile.open(QIODevice::ReadOnly))
        inFile.read(headBuf,HEADLEN);//wav头部
    if(outFile.open(QIODevice::WriteOnly))
        outFile.write(headBuf,HEADLEN);

    while(inFile.atEnd() == false)
    {
        len = inFile.read(dataBuf,SAMPLES_PER_FRAME);
        if(len == 0) break;

        chw_rtcaec_preprocess_run(m_aec->session,(short*)dataBuf);
        outFile.write(dataBuf,SAMPLES_PER_FRAME);
    }

    inFile.flush();
    inFile.close();
    outFile.flush();
    outFile.close();
}
//回声消除,播放对方音频后调用
void spxMainWindow::dealEchoPlay(short* pbuf,int32_t plen)
{
    if(m_aec) m_aec->echoPlayback(m_aec->session,pbuf);
}
//回声采样和去噪,采集本端音频后,编码前调用
void spxMainWindow::putEchoBuffer( uint8_t *pBuffer,int32_t plen)
{
    if (m_aec)
    {
        m_aec->echoCapture(m_aec->session, (short*) pBuffer, pcm);
        m_aec->preprocessRun(m_aec->session, pcm);
        m_audioFrame.data = (uint8_t*)pcm;
        m_audioFrame.len = plen;
//        m_resample.resample(m_resample.context,&m_audioFrame);
    }
}

报错记录

使用回声消除时报如下几个警告:

waining:no playback frame available(your application is buggy and/or got xruns),#ifndef DISABLE_WARNINGS
warning: Had to discard a playback frame (your application is buggy and/or got xruns)
warning: Auto-filling the buffer (your application is buggy and/or got xruns)

基本不影响业务,看着不顺眼的可以修改libspeexdsp源码里的os_support.h文件,在里面添加下面定义,不打印WARNINGS信息,重新编译即可。

#define DISABLE_WARNINGS

有关speexdsp库实现音频3A算法,speexdsp库编译,C/C++的更多相关文章

  1. ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2

    我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征,我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现,但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden

  2. ruby - Sinatra set cache_control to static files in public folder编译错误 - 2

    我不知道为什么,但是当我设置这个设置时它无法编译设置:static_cache_control,[:public,:max_age=>300]这是我得到的syntaxerror,unexpectedtASSOC,expecting']'(SyntaxError)set:static_cache_control,[:public,:max_age=>300]^我只想将“过期”header设置为css、javaascript和图像文件。谢谢。 最佳答案 我猜您使用的是Ruby1.8.7。Sinatra文档中显示的语法似乎是在Ruby1.

  3. 区块链之加解密算法&数字证书 - 2

    目录一.加解密算法数字签名对称加密DES(DataEncryptionStandard)3DES(TripleDES)AES(AdvancedEncryptionStandard)RSA加密法DSA(DigitalSignatureAlgorithm)ECC(EllipticCurvesCryptography)非对称加密签名与加密过程非对称加密的应用对称加密与非对称加密的结合二.数字证书图解一.加解密算法加密简单而言就是通过一种算法将明文信息转换成密文信息,信息的的接收方能够通过密钥对密文信息进行解密获得明文信息的过程。根据加解密的密钥是否相同,算法可以分为对称加密、非对称加密、对称加密和非

  4. 华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2

    华为OD机试题本篇题目:明明的随机数题目输入描述输出描述:示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od,od薪资待遇,od机试题清单华为OD机试真题大全,用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o

  5. 基于C#实现简易绘图工具【100010177】 - 2

    C#实现简易绘图工具一.引言实验目的:通过制作窗体应用程序(C#画图软件),熟悉基本的窗体设计过程以及控件设计,事件处理等,熟悉使用C#的winform窗体进行绘图的基本步骤,对于面向对象编程有更加深刻的体会.Tutorial任务设计一个具有基本功能的画图软件**·包括简单的新建文件,保存,重新绘图等功能**·实现一些基本图形的绘制,包括铅笔和基本形状等,学习橡皮工具的创建**·设计一个合理舒适的UI界面**注明:你可能需要先了解一些关于winform窗体应用程序绘图的基本知识,以及关于GDI+类和结构的知识二.实验环境Windows系统下的visualstudio2017C#窗体应用程序三.

  6. MIMO-OFDM无线通信技术及MATLAB实现(1)无线信道:传播和衰落 - 2

     MIMO技术的优缺点优点通过下面三个增益来总体概括:阵列增益。阵列增益是指由于接收机通过对接收信号的相干合并而活得的平均SNR的提高。在发射机不知道信道信息的情况下,MIMO系统可以获得的阵列增益与接收天线数成正比复用增益。在采用空间复用方案的MIMO系统中,可以获得复用增益,即信道容量成倍增加。信道容量的增加与min(Nt,Nr)成正比分集增益。在采用空间分集方案的MIMO系统中,可以获得分集增益,即可靠性性能的改善。分集增益用独立衰落支路数来描述,即分集指数。在使用了空时编码的MIMO系统中,由于接收天线或发射天线之间的间距较远,可认为它们各自的大尺度衰落是相互独立的,因此分布式MIMO

  7. 【Java入门】使用Java实现文件夹的遍历 - 2

    遍历文件夹我们通常是使用递归进行操作,这种方式比较简单,也比较容易理解。本文为大家介绍另一种不使用递归的方式,由于没有使用递归,只用到了循环和集合,所以效率更高一些!一、使用递归遍历文件夹整体思路1、使用File封装初始目录,2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组,取出每个File对象4-1、如果File是否是一个文件,打印4-2、否则就是一个目录,递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg

  8. 安卓apk修改(Android反编译apk) - 2

    最近因为项目需要,需要将Android手机系统自带的某个系统软件反编译并更改里面某个资源,并重新打包,签名生成新的自定义的apk,下面我来介绍一下我的实现过程。APK修改,分为以下几步:反编译解包,修改,重打包,修改签名等步骤。安卓apk修改准备工作1.系统配置好JavaJDK环境变量2.需要root权限的手机(针对系统自带apk,其他软件免root)3.Auto-Sign签名工具4.apktool工具安卓apk修改开始反编译本文拿Android系统里面的Settings.apk做demo,具体如何将apk获取出来在此就不过多介绍了,直接进入主题:按键win+R输入cmd,打开命令窗口,并将路

  9. ruby - Arrays Sets 和 SortedSets 在 Ruby 中是如何实现的 - 2

    通常,数组被实现为内存块,集合被实现为HashMap,有序集合被实现为跳跃列表。在Ruby中也是如此吗?我正在尝试从性能和内存占用方面评估Ruby中不同容器的使用情况 最佳答案 数组是Ruby核心库的一部分。每个Ruby实现都有自己的数组实现。Ruby语言规范只规定了Ruby数组的行为,并没有规定任何特定的实现策略。它甚至没有指定任何会强制或至少建议特定实现策略的性能约束。然而,大多数Rubyist对数组的性能特征有一些期望,这会迫使不符合它们的实现变得默默无闻,因为实际上没有人会使用它:插入、前置或追加以及删除元素的最坏情况步骤复

  10. ruby - "public/protected/private"方法是如何实现的,我该如何模拟它? - 2

    在ruby中,你可以这样做:classThingpublicdeff1puts"f1"endprivatedeff2puts"f2"endpublicdeff3puts"f3"endprivatedeff4puts"f4"endend现在f1和f3是公共(public)的,f2和f4是私有(private)的。内部发生了什么,允许您调用一个类方法,然后更改方法定义?我怎样才能实现相同的功能(表面上是创建我自己的java之类的注释)例如...classThingfundeff1puts"hey"endnotfundeff2puts"hey"endendfun和notfun将更改以下函数定

随机推荐