草庐IT

语音模组

全部标签

javascript - 语音合成 API 在说话时突出显示单词

目前,我正在制作一个简单的应用程序,其中使用语音合成API来朗读文本。我想在说话时突出显示单词(粗体)。我目前有一个非常基本的实现,使用'onboundary'事件来执行此操作。但是,我想知道是否有更好/更好的方法,因为我的实现是基于一些假设。varwords;varwordIdx;vartext;varutterance=newSpeechSynthesisUtterance();utterance.lang='en-UK';utterance.rate=1;window.onload=function(){document.getElementById('textarea').in

javascript - Annyang语音识别问题

我目前正在尝试创建自己的J.A.R.V.I.S系统作为网络应用程序。所以当然,就像任何好的J.A.R.V.I.S系统一样,它需要良好的语音识别。我进行了研究,试图找到一个我可以根据需要自定义的JavaScript语音识别API,并决定使用Annyang。(很简单,效果很好)我花了一些时间试用它,就在我认为它可以正常工作时,我遇到了一个问题。当我尝试在本地查看该文件时它不起作用,所以我将它与MAMP一起托管在我的计算机上以查看它是否有效。它出现了一个对话框,上面写着“本地主机想要访问麦克风”,但是当我点击允许时,它又出现了。它不断出现并且不会消失,直到我单击拒绝。我正在使用以下代码:if

B44 - 基于stm32蓝牙智能语音识别分类播报垃圾桶

文章目录任务效果原理图指令编码语音识别模块简介代码设计驱动舵机模块简介驱动主程序源代码任务题目:基于stm32蓝牙智能语音识别分类播报垃圾桶实现功能如下:语音识别根据使用者发出的指令自动对垃圾进行分类根据垃圾的种类实时播报垃圾的类型根据垃圾种类驱动对应的舵机进行转动(模拟垃圾桶打开,并在十秒钟自动复位,模拟垃圾桶关闭)OLED显示屏实时显示四种垃圾桶的状态蓝牙app可以控制垃圾桶开关,同时显示四种垃圾桶状态效果原理图指令编码语音识别模块简介LU-ASR01是一款低成本、低功耗、体积小、高性能的离线语音识别系统。本系统集成了语音识别、语音回复、IO控制(多信号输出)、串口输出、温湿度广播等功能。

STM32开发 | 移远4G-Cat.1模组EC200N-CN开发

一、硬件说明1、引脚分配图2、常用引脚说明模块输入电源引脚名描述VBAT_BB模块基带电源(Vnom=3.8V)VBAT_RF模块射频电源(Vnom=3.8V)GND接地引脚模块输出电源引脚名描述VDD_EXT外部电路1.8V供电(Vnom=1.8V)开/关机引脚名描述RESET_N模块复位(低电平有效,1.8V电压域,不用则悬空。)PWRKEY模块开/关机(VBAT电压域)SIM接口引脚名描述USIM_VDD(U)SIM供电电源(模块自动识别1.8V或3.0V(U)SIM卡。)USIM_DATA(U)SIM数据USIM_CLK(U)SIM时钟USIM_RST(U)SIM复位主串口引脚名描述M

javascript - 语音识别和getUserMedia

我正在构建一个Web应用程序并计划同时使用speechRecognition和navigator.getUserMedia用于音频输入。我注意到我的桌面浏览器(Mac上的Chrome,v.31.0.1650.63)两次请求使用麦克风的权限。虽然这对用户来说可能有点烦人,但语音识别和音频输入似乎都有效。但是,如果我在Android(Nexus7,Androidv4.4.2;Chromev31.0.1650.59)上打开同一个页面,它会两次询问是否允许使用我的麦克风,但我只能使用两者之一(以先开始的为准)。有时,即使我已授予访问麦克风的权限,我也会收到语音识别错误:“不允许”错误。我做了一

javascript - web speech api语音合成-获取语音列表

我在使用网络语音API时遇到了一个奇怪的问题。我已经设置了一些代码来说出一串文本——很少,它会用正常的声音说出来(MacOSX中听写和语音设置中的“Alex”)。但通常情况下,它会用“Albert”的声音说话。我正在查看此处列出的w3c网络语音API:https://dvcs.w3.org/hg/speech-api/raw-file/tip/speechapi.html#dfn-ttsgetvoices还有一个接口(interface)叫做SpeechSynthesisVoiceList{}我正在尝试访问此功能,但我不能。我如何访问此语音列表?我正在使用chromecanary,我已

javascript - 为什么我的 Speech Synthesis API 语音在功能运行超过 1 次时会发生变化?

我一直在使用Chrome(33及更高版本)中的新语音合成API来制作基于网络的通信辅助工具。我希望用户能够改变男性和女性之间的声音,API允许我这样做。但是,当页面首次加载和函数第一次运行时(从onclick事件),它使用默认的女声。然后任何时候运行它,它都会使用我想要使用的男声。我怎样才能让男声也第一次跑?这是调用javascript的按钮:这里是被调用的speakPhrase函数:functionspeakPhrase(phrase){if(phrase==""){alert("Pleaseenteraphrasebeforeaskingmetospeakforyou.Thanky

javascript - 谷歌翻译 API 文本到语音 : http requests forbidden

我正在制作一个语言学习网络应用程序,当您将鼠标悬停在单词上时,它会为您发音。我想从GoogleTranslateAPI访问母语人士的翻译。我找到了thisresource它给出http://translate.google.com/translate_tts作为基本URL,tl作为目标语言,q作为查询字符串。当我只在浏览器中访问它时,它的效果非常好,http://translate.google.com/translate_tts?tl=zh-CN&q=你好,但是我的应用程序的任何httprequests都会返回403禁止错误。localhost:~me$wget"http://tra

javascript - 跨浏览器语音识别

我目前正在ASP.NET中开发一个项目。我需要添加适用于IE/Chrome/Firefox的语音命令。我搜索了很多,但没有找到任何跨浏览器的解决方案。是否有任何JavaScript框架可以做到这一点?我可以使用Google网络语音API作为服务吗?任何建议都会有所帮助。 最佳答案 只要浏览器支持HTML5的getUserMediaAPI就可以做到:使用HTML5的getUserMedia捕获音频流将其保存为.WAV,有相应的库通过AJAX发送.WAV到服务器通过SetInputToWaveFile方法将.WAV提供给SpeechRe

Minecraft 1.19.2 Forge模组开发 11.Mixin

我们本次使用Mixin在1.19.2中制作一个属于自己的不死图腾。演示效果演示效果演示效果什么是Mixin?简单来说是通过注入一些我们的代码,达到对MC原版内容的修改。详细内容可以参考Minecraft17.1Mixin1.首先我们需要在开发包中引入mixin的依赖,来到项目的build.gradle文件:build.gradleplugins{id'eclipse'id'maven-publish'id'net.minecraftforge.gradle'version'5.+'//引入这个mixin依赖id'org.spongepowered.mixin'version'0.7-SNAPS