草庐IT

语音播报

全部标签

javascript - 语音合成 API 在说话时突出显示单词

目前,我正在制作一个简单的应用程序,其中使用语音合成API来朗读文本。我想在说话时突出显示单词(粗体)。我目前有一个非常基本的实现,使用'onboundary'事件来执行此操作。但是,我想知道是否有更好/更好的方法,因为我的实现是基于一些假设。varwords;varwordIdx;vartext;varutterance=newSpeechSynthesisUtterance();utterance.lang='en-UK';utterance.rate=1;window.onload=function(){document.getElementById('textarea').in

javascript - Annyang语音识别问题

我目前正在尝试创建自己的J.A.R.V.I.S系统作为网络应用程序。所以当然,就像任何好的J.A.R.V.I.S系统一样,它需要良好的语音识别。我进行了研究,试图找到一个我可以根据需要自定义的JavaScript语音识别API,并决定使用Annyang。(很简单,效果很好)我花了一些时间试用它,就在我认为它可以正常工作时,我遇到了一个问题。当我尝试在本地查看该文件时它不起作用,所以我将它与MAMP一起托管在我的计算机上以查看它是否有效。它出现了一个对话框,上面写着“本地主机想要访问麦克风”,但是当我点击允许时,它又出现了。它不断出现并且不会消失,直到我单击拒绝。我正在使用以下代码:if

B44 - 基于stm32蓝牙智能语音识别分类播报垃圾桶

文章目录任务效果原理图指令编码语音识别模块简介代码设计驱动舵机模块简介驱动主程序源代码任务题目:基于stm32蓝牙智能语音识别分类播报垃圾桶实现功能如下:语音识别根据使用者发出的指令自动对垃圾进行分类根据垃圾的种类实时播报垃圾的类型根据垃圾种类驱动对应的舵机进行转动(模拟垃圾桶打开,并在十秒钟自动复位,模拟垃圾桶关闭)OLED显示屏实时显示四种垃圾桶的状态蓝牙app可以控制垃圾桶开关,同时显示四种垃圾桶状态效果原理图指令编码语音识别模块简介LU-ASR01是一款低成本、低功耗、体积小、高性能的离线语音识别系统。本系统集成了语音识别、语音回复、IO控制(多信号输出)、串口输出、温湿度广播等功能。

javascript - 语音识别和getUserMedia

我正在构建一个Web应用程序并计划同时使用speechRecognition和navigator.getUserMedia用于音频输入。我注意到我的桌面浏览器(Mac上的Chrome,v.31.0.1650.63)两次请求使用麦克风的权限。虽然这对用户来说可能有点烦人,但语音识别和音频输入似乎都有效。但是,如果我在Android(Nexus7,Androidv4.4.2;Chromev31.0.1650.59)上打开同一个页面,它会两次询问是否允许使用我的麦克风,但我只能使用两者之一(以先开始的为准)。有时,即使我已授予访问麦克风的权限,我也会收到语音识别错误:“不允许”错误。我做了一

javascript - web speech api语音合成-获取语音列表

我在使用网络语音API时遇到了一个奇怪的问题。我已经设置了一些代码来说出一串文本——很少,它会用正常的声音说出来(MacOSX中听写和语音设置中的“Alex”)。但通常情况下,它会用“Albert”的声音说话。我正在查看此处列出的w3c网络语音API:https://dvcs.w3.org/hg/speech-api/raw-file/tip/speechapi.html#dfn-ttsgetvoices还有一个接口(interface)叫做SpeechSynthesisVoiceList{}我正在尝试访问此功能,但我不能。我如何访问此语音列表?我正在使用chromecanary,我已

javascript - 为什么我的 Speech Synthesis API 语音在功能运行超过 1 次时会发生变化?

我一直在使用Chrome(33及更高版本)中的新语音合成API来制作基于网络的通信辅助工具。我希望用户能够改变男性和女性之间的声音,API允许我这样做。但是,当页面首次加载和函数第一次运行时(从onclick事件),它使用默认的女声。然后任何时候运行它,它都会使用我想要使用的男声。我怎样才能让男声也第一次跑?这是调用javascript的按钮:这里是被调用的speakPhrase函数:functionspeakPhrase(phrase){if(phrase==""){alert("Pleaseenteraphrasebeforeaskingmetospeakforyou.Thanky

javascript - 谷歌翻译 API 文本到语音 : http requests forbidden

我正在制作一个语言学习网络应用程序,当您将鼠标悬停在单词上时,它会为您发音。我想从GoogleTranslateAPI访问母语人士的翻译。我找到了thisresource它给出http://translate.google.com/translate_tts作为基本URL,tl作为目标语言,q作为查询字符串。当我只在浏览器中访问它时,它的效果非常好,http://translate.google.com/translate_tts?tl=zh-CN&q=你好,但是我的应用程序的任何httprequests都会返回403禁止错误。localhost:~me$wget"http://tra

javascript - 跨浏览器语音识别

我目前正在ASP.NET中开发一个项目。我需要添加适用于IE/Chrome/Firefox的语音命令。我搜索了很多,但没有找到任何跨浏览器的解决方案。是否有任何JavaScript框架可以做到这一点?我可以使用Google网络语音API作为服务吗?任何建议都会有所帮助。 最佳答案 只要浏览器支持HTML5的getUserMediaAPI就可以做到:使用HTML5的getUserMedia捕获音频流将其保存为.WAV,有相应的库通过AJAX发送.WAV到服务器通过SetInputToWaveFile方法将.WAV提供给SpeechRe

基于51单片机的多功能智能语音循迹避障小车

目录一.功能介绍及硬件准备二.电机控制及调速三.小车循迹方案四.跟随功能实现五.测速功能实现六.OLED显示车速七.摇头避障功能实现八.SU-03T语音模块介绍九.语音切换小车模式+OLED显示模式一.功能介绍及硬件准备这是一款基于51单片机开发的智能小车,通过这篇文章我会记录下来开发这款小车的全部过程。这款小车集成了循迹,避障,跟随,语音切换模式选择,并且将可以将车速显示到OLED屏幕上,也可以通过手机app蓝牙操控小车。(注:全文的代码采取分文件编程的写法)硬件准备小车底盘一个(两驱),5号4节电池盒一个,51单片机最小系统一个,HC04超声波模块一个,SG90舵机一个,红外避障模块传感器

c# - 从 xml 文件读取语法时,语音识别 : Result. Semantic.ContainsKey 始终为 false

我正在研究Microsoft.Speech库。它类似于System.Speech库。我遇到了一个问题,我认为这可能是一个错误。我试图使用e.Result.Semantic.ContainsKey("DestinationCity")来确定它是否有key。当我从GrammarBuilder加载语法时,我得到一个true表示“我想从纽约飞往芝加哥”。然后我将语法写入xml文件并再次从该文件加载语法。这一次,当我说“我想从纽约飞往芝加哥”时,我得到了一个false。我不知道为什么会这样。这是我的代码:classProgram{staticvoidMain(string[]args){//Cr