草庐IT

speech_recognition

全部标签

python - 为 Google Speech API 创建合适的 WAV 文件

我正在使用pyaudio将我的声音录制为wav文件。我正在使用以下代码:defvoice_recorder():FORMAT=pyaudio.paInt16CHANNELS=2RATE=22050CHUNK=1024RECORD_SECONDS=4WAVE_OUTPUT_FILENAME="first.wav"audio=pyaudio.PyAudio()#startRecordingstream=audio.open(format=FORMAT,channels=CHANNELS,rate=RATE,input=True,frames_per_buffer=CHUNK)print"k

html - 使用 Webkit speech api 进行连续语音识别

我开始使用这个浏览器(chrome)功能。我已经基于此编写了一个JS,但问题是,它只识别一次语音就结束了。它不会持续进行,我需要一次又一次地按下按钮才能开始语音识别。告诉我应该在哪里调整。我设置了“recognition.continuous=true”仍然没有帮助?varrecognition=newwebkitSpeechRecognition();recognition.continuous=true;recognition.interimResults=true;recognition.onstart=function(){console.log("Recognitionsta

html - 请求 Google Text-To-Speech API

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我有这个网址:http://translate.google.com/translate_tts?ie=utf-8&tl=en&q=Hello+world当我把它放到浏览器的地址栏并按回车键时,我得到了带有合成语音的mp3文件,上面写着“Helloworld”。一切都是正确的。但现在我在HTML中有一个重定向到此URL的链接,如下所示:Link当我点击这个链接时,我没有得到一个文件,而是一个错

javascript - Web Speech API 中语法的作用

在WebSpeechAPI的示例中,始终指定语法。例如,在MDN'scolourchangeexample中,语法是:#JSGFV1.0;grammarcolors;public=aqua|azure|beige|bisque|black|blue|brown|chocolate|coral|crimson|cyan|fuchsia|ghostwhite|gold|goldenrod|gray|green|indigo|ivory|khaki|lavender|lime|linen|magenta|maroon|moccasin|navy|olive|orange|orchid|per

javascript - Web Speech API 自定义词

我通读了W3Cdocs对此,我认为自定义词来自自定义语法,但我尝试转到thisdemo并在控制台中输入以下javascript:recognition.grammars.addFromString('foo');运行良好,recognition.grammars[0].src返回:"data:application/xml,foo"注意:'foo'不是我感兴趣的词,但我感兴趣的词不是英语词,以'foo'为例。当我正常说我的习惯词时,它认为我在说别的东西(这是有道理的)。我在这里使用“foo”来保护我的品牌:)所以我想要的是能够说“Hey,foo”,类似于“Ok,Google”的工作方式

javascript - 将 x-webkit-speech 与文本区域一起使用

我的网络应用程序中有一个字段,用户可以在其中输入大量文本。我想实现x-webkit-speech元素。它适用于所有框,但我无法在中呈现它 最佳答案 目前它只适用于输入。我假设最终会支持更长的文本输入,但由于用户可能希望记录更长的条目,我怀疑他们担心处理的准确性和时间会受到影响。 关于javascript-将x-webkit-speech与文本区域一起使用,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com

html - 在 HTML/JavaScript 扩展中使用 x-webkit-speech

我正在尝试在GoogleChrome中的一个简单的HTML/JavaScript扩展中使用新的x-webkit-speech函数.但是,我已经尝试并尝试查看一堆示例,但无法成功调用该函数。我见过其他人这样做,但我真的不明白为什么我做不到。我将JavaScript代码放入一个单独的文件中,但我包括使用这是我的x-webkit-speech行....现在,如果我将onChange()更改为alert(this.value),它会执行一个带有语音输入值的警告框。所以我真的不明白为什么我不能只调用另一个函数。我不是最伟大的JavaScript或HTML程序员,但我对此进行了大量研究。每个人对事

ios - 如何在 iOS Speech API 上检测语音开始

我有一个用XCode/objectiveC开发的iOS应用程序。它使用iOSSpeechAPI来处理连续语音识别。它正在工作,但我想在语音开始时将麦克风图标变为红色,我还想检测语音何时结束。我实现了SFSpeechRecognitionTaskDelegate接口(interface),它提供回调onDetectedSpeechStart和speechRecognitionTask:didHypothesizeTranscription:但这些直到处理第一个单词的结尾才会发生,而不是在语音的最开始。我想检测语音的开头(或任何噪音)。我认为它应该可以从installTapOnBus:从A

ios - iOS 中是否有与 Android 的 Activity Recognition API 等效的功能?

在上一届GoogleI/O大会上,Android的LocationAPI中引入了一项新服务-事件识别。iOS有这样的框架吗? 最佳答案 我意识到这个问题很老了,但以供将来引用CMMotionActivity提供此功能。iOS7的新功能,由M7协处理器启用。 关于ios-iOS中是否有与Android的ActivityRecognitionAPI等效的功能?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

html - 是否可以使 "HTML to speech"与 "Text to speech"相同?

我有一个奇怪的要求,即在我现有的应用程序中我有Text2Speech并且为此,我使用了AVSpeechSynthesizer来语音文本,但现在要求改变了,现在我需要将HTML文件数据转换为类似于HTML2Speech的文本。我们可以想到的一种解决方案:useHTMLparsingandgetalltextfromHTMLandusesameframeworkforText2Speech.但客户不想要那种类型的解析,他想要任何直接提供HTML2Speech功能的API或框架。任何建议或帮助将不胜感激。 最佳答案 由于我在此处使用HTM