语音_草庐IT

开源语音聊天软件Mumble

网友大气告诉我，Openblocks在国内还有个版本叫码匠，更贴合国内软件开发的需求，如接入了国内常用的身份认证，接入了国内的数据库和云服务，也对小程序、企微sdk等场景做了适配。在https://majiang.co/docs/docker，你能找到码匠的docker版部署教程，安装和Openblocks一样简单。网友赵云在找KOOK和Discord那样的web直接用的实时语音聊天，老苏翻了一下写过的文章，可能最接近Discord的就是VoceChat了，但是单纯从语音聊天来说，Mumble也是非常好用的；什么是Mumble?Mumble是一个基于Qt和Opus编写的开源、低延迟和高质量语音

Arduino实现语音实时播报当前温湿度

这几天气温极高，重庆竟然超过了44℃，我所在的杭州也达到了有气象记录以来的最高温41.8℃，于是心血来潮，做一个简单快速的语音播报当前实测到的温度，看看当前温度究竟是多少？手头正好有一个DHT11的测温湿度模块，该模块采用专用的数字模块采集技术和温湿度传感技术，确保产品具有极高的可靠性与卓越的长期稳定性。传感器包括一个电阻式感湿元件和一个NTC测温元件，并与一个高性能8位单片机相连接。因此该产品具有品质卓越、超快响应、抗干扰能力强、性价比极高等优点。每个DHT11传感器都在极为精确的湿度校验室中进行校准。校准系数以程序的形式储存在OTP内存中，传感器内部在检测信号的处理过程中要调用这些

Android 离线文字转语音功能-TTS(Text To Speech)

前言在Android中，TTS全称叫做TexttoSpeech，从字面就能理解它解决的问题是什么，把文本转为语音服务，意思就是你输入一段文本信息，然后Android系统可以把这段文字播报出来。这种应用场景目前比较多是在各种语音助手APP上，很多手机系统集成商内部都有内置文本转语音服务，可以读当前页面上的文本信息。同样，在一些阅读类APP上我们也能看到相关服务，打开微信读书，里面就直接可以把当前页面直接用语音方式播放出来，特别适合哪种不方便拿着手机屏幕阅读的场景。 Android系统从1.6版本开始就支持TTS,不过遗憾的是系统默认的TTS引擎:PicoTTS，并不支持中文。

今日新闻：苹果公司发布的iOS 16操作系统，微软公司以75亿美元的价格收购GitHub，华为公司发布的鸿蒙芯片NH310，Booking.com推出的“Booking Assistant”语音助手

今日新闻：苹果公司发布的iOS16操作系统：a.“应用隐私报告”功能：用户可以查看每个应用请求访问的个人数据，并针对性地允许或拒绝访问权限。b.Siri语音交互功能的升级：Siri现在的响应速度更快，而且还可用于更复杂的任务，例如调节屏幕亮度、音量和翻译等。c.“LiveText”功能：从照片或视频中提取文字，帮助用户更快地搜索和编辑相关信息。d.新的翻译应用程序：用户可以更轻松地翻译不同的语言。微软公司以75亿美元的价格收购GitHub：a.GitHub是全球最受欢迎的代码托管平台之一，拥有众多用户和开发者。b.微软表示，这笔交易将增强其在开放源代码社区中的地位，使其能够更深入地参与开源软件

无需开机卡，实现手机自带语音助手控制电脑开关机

一、在手机和电脑下载ToDesk，文章结尾有下载链接注：次方法只能在局域网内使用二、在路由器添加静态IP，需要电脑MAC地址，以下是MAC地址注：每台电脑网卡的MAC地址不一样进入到路由器地址添加IP地址和MAC地址如图打开控制面板，把地址改成添加过的IP地址如图三、进入BIOS在开启网络启动功能，以下是教程链接开启网络启动功能https://www.asus.com.cn/support/FAQ/1001663/四、开启网络唤醒打开手机端ToDesk-我的-设置，开启远程开机支持wake-on-lan注：ToDesk手机和电脑必须登入同一账户，否者下次会失效这里先试一下能不能ToDesk

【实验】语音识别

为学校数字信号处理实验总结和归纳；语音识别题目及相关要求在here.数据预处理大致步骤：获取原始音频检测分帧加窗特征提取端点检测端点检测参数指标相对值初始短时能量高门限50初始短时能量低门限10初始短时过零率高门限10初始短时过零率低门限2最大静音长度8ms语音最小长度20ms这里我们进行的是基于阈值的VAD，通过提取时域（短时能量、短期过零率等）或频域(MFCC、频谱等）特征，通过合理的设置门限，达到区分语音和非语音的目的。我们的端点检测初始特征阙值如右表所示，通过这样的指标，我们检测出来的音频信息可以过滤掉大部分的噪音。部分数字与名字信号的双端检测结果如下所示：分帧由于语音信号具有短时的平

微信小程序将语音转为文字（插件：微信同声传译）

1.接入流程：设置->第三方设置->添加插件2.配置去app.json进行配置，与window同级"plugins":{"WechatSI":{"version":"0.3.5","provider":"wx069ba97219f66d99"}}3.代码实现3_1.wxml代码{content}}'>按住说话松开结束{recordState==true}}">开始语音3-2.js实现代码constapp=getApp();//引入插件：微信同声传译constplugin=requirePlugin('WechatSI');//获取全局唯一的语音识别管理器recordRecoManagercon

语音增强之谱减法

语音增强之谱减法语音增强之谱减法原理介绍缺点和改进代码实现仿真结果参考文献原理介绍谱减法(SpectralSubtraction)是最早出现的语音增强算法之一，由于实现简单且实时性较好，获得了广泛的应用。它假设语音和噪声是加性混合，且噪声是缓慢变化的，通过在静音段估计和更新噪声频谱，从带噪语音谱中减去噪声来增强语音。设y(n)y(n)y(n)为带噪语音信号，由纯净语音信号x(n)x(n)x(n)和噪声信号d(n)d(n)d(n)混合形成y(n)=x(n)+d(n)y(n)=x(n)+d(n)y(n)=x(n)+d(n)对等式两边做傅里叶变换转换到频域Y(ω)=X(ω)+D(ω)Y(\omega

snowboy+新一代kaldi（k2-fsa）sherpa-onnx实现离线语音识别【语音助手】

背景本系列主要目标初步完成一款智能音箱的基础功能，包括语音唤醒、语音识别(语音转文字)、处理用户请求（比如查天气等，主要通过rasa自己定义意图实现）、语音合成(文字转语音)功能。语音识别、语音合成采用离线方式实现。语音识别使用sherpa-onnx，可以实现离线中英文语音识别。本文用到的一些安装包在snowboy那一篇的必要条件中已经完成了部分构建，在离线语音识别安装完成之后也会把相关代码写到snowboy项目中，语音唤醒之后调用语音识别翻译用户说话的内容。语音唤醒文章地址：snowboy自定义唤醒词实现语音唤醒【语音助手】_殷长庆的博客-CSDN博客参考文章sherpa-onnx教程（强烈

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

诸公可知目前最牛逼的TTS免费开源项目是哪一个？没错，是Bert-vits2，没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型，基本上解决了VITS的语气韵律问题，在效果非常出色的情况下训练的成本开销普通人也完全可以接受。BERT的核心思想是通过在大规模文本语料上进行无监督预训练，学习到通用的语言表示，然后将这些表示用于下游任务的微调。相比传统的基于词嵌入的模型，BERT引入了双向上下文信息的建模，使得模型能够更好地理解句子中的语义和关系。BERT的模型结构基于Transformer，它由多个编码器层组成。每个编码器层都有多头自注意力机制和前馈神经网络，用于对输入序列进行多