speech-recognition

javascript - web speech api语音合成-获取语音列表

我在使用网络语音API时遇到了一个奇怪的问题。我已经设置了一些代码来说出一串文本——很少，它会用正常的声音说出来(MacOSX中听写和语音设置中的“Alex”)。但通常情况下，它会用“Albert”的声音说话。我正在查看此处列出的w3c网络语音API:https://dvcs.w3.org/hg/speech-api/raw-file/tip/speechapi.html#dfn-ttsgetvoices还有一个接口(interface)叫做SpeechSynthesisVoiceList{}我正在尝试访问此功能，但我不能。我如何访问此语音列表？我正在使用chromecanary，我已

javascript speech 34 Google false google-chrome webkit speech-recognition text-to-speech

javascript - 为什么我的 Speech Synthesis API 语音在功能运行超过 1 次时会发生变化？

我一直在使用Chrome(33及更高版本)中的新语音合成API来制作基于网络的通信辅助工具。我希望用户能够改变男性和女性之间的声音，API允许我这样做。但是，当页面首次加载和函数第一次运行时(从onclick事件)，它使用默认的女声。然后任何时候运行它，它都会使用我想要使用的男声。我怎样才能让男声也第一次跑？这是调用javascript的按钮:这里是被调用的speakPhrase函数:functionspeakPhrase(phrase){if(phrase==""){alert("Pleaseenteraphrasebeforeaskingmetospeakforyou.Thanky

javascript Synthesis speechSynthesis section speech text-to-speech speech-synthesis google-text-to-speech

javascript - x-webkit-speech，如何自动点击麦克风图标自动录制很多单词？

我正在使用Chrome浏览器。代码将显示:如果你点击麦克风图标，你可以输入语音。像这样我的问题是如何让它录制语音自动识别，无需手动点击麦克风图标？比如当页面加载完毕，就开始记录；或者编写代码来模拟点击事件？可能吗？你能给一个示例代码或x-webkit-speechAPI的文档吗？谢谢。最佳答案这不应该是可能的，因为如果是的话，这将是一种隐私危害——一个页面可能会在用户没有意识到或没有意识到的情况下开始记录附近所说的话。如果有任何方法可以做到这一点，一旦浏览器开发人员意识到这个问题，它肯定会被删除。

x-webkit-speech 麦克风 section strong javascript google-chrome speech-recognition

javascript - 跨浏览器语音识别

我目前正在ASP.NET中开发一个项目。我需要添加适用于IE/Chrome/Firefox的语音命令。我搜索了很多，但没有找到任何跨浏览器的解决方案。是否有任何JavaScript框架可以做到这一点？我可以使用Google网络语音API作为服务吗？任何建议都会有所帮助。最佳答案只要浏览器支持HTML5的getUserMediaAPI就可以做到:使用HTML5的getUserMedia捕获音频流将其保存为.WAV，有相应的库通过AJAX发送.WAV到服务器通过SetInputToWaveFile方法将.WAV提供给SpeechRe

javascript 浏览器 section li speech-recognition-in-asp-net asp.net cross-browser speech-recognition speech-to-text

c# - 从 xml 文件读取语法时，语音识别 : Result. Semantic.ContainsKey 始终为 false

我正在研究Microsoft.Speech库。它类似于System.Speech库。我遇到了一个问题，我认为这可能是一个错误。我试图使用e.Result.Semantic.ContainsKey("DestinationCity")来确定它是否有key。当我从GrammarBuilder加载语法时，我得到一个true表示“我想从纽约飞往芝加哥”。然后我将语法写入xml文件并再次从该文件加载语法。这一次，当我说“我想从纽约飞往芝加哥”时，我得到了一个false。我不知道为什么会这样。这是我的代码:classProgram{staticvoidMain(string[]args){//Cr

c#ContainsKey 34 gt lt xml speech-recognition microsoft-speech-platform

xml - Speech Macro XML 中有多个 listenFor 标签

我最近开始接触windows语音宏，它允许您为windows语音识别制作自定义命令。目前，我只能对它说一件事，它可以响应并执行命令，但我希望它像OKGOOGLE一样，我首先说出它的名字，然后它为实际命令做好准备，除非我说取消，这是我所拥有的示例:(我的系统称为J-SIB，它称我为Vulpix.JS)JaySib,StartChromeYesSir,MisterVulpixDotJayEs但我希望它是这样的:JaySibYesSir?StartChromeYesSir,MisterVulpixDotJayEs我怎么能在我不说命令的地方得到它呢？因为每当我尝试上面的命令时，它都会说有错误。

listenFor Speech lt gt xml macros

xml - 当我重复项目时，如何在 grxml 文件中使用语义标记？

我正在为将使用Microsoft的语音SDK进行语音识别的软件构建GRXML语法。标签必须遵循标签格式“properties-ms/1.0”，我没有找到任何具体文档(除了MSDN没有回答我的问题)。我主要关心的是标记数字以便将可识别的文本(如“一二三四”)转换为数字“1234”。这是想法:one"1"two"2"three"3"four"4"five"5"这没有连接，但至少我得到了每个数字的语义值。但是，当我对数字使用这样的规则时，程序在运行时中断，抛出一个异常，指出“规则‘CODE’中的语义值已经设置，无法更改。”。如何使语义标记与DIGIT规则的“重复”一起工作？我不希望将我的CO

何在 grxml lt gt item xml grammar speech-recognition voice-recognition

xml - 在 grxml 文件中切换可识别的项目

我已经创建了一个语法(以grxml格式)来识别OMV文字(使用hu-hu语言设置)这是有问题的部分:oemfau细微差别识别它，并打印“oemfau”，但我希望细微差别说，这个词不是oemfau，而是OMV。我怎样才能切换单词？最佳答案如果您的语法使用tag-format="swi-semantics/1.0，您可以在中使用ECMAScript像这样的元素:oemfauout.slot="OMV"只需将“插槽”替换为您想在应用程序中使用的任何NL插槽即可。关于x

grxml xml section code oemfau grammar speech-recognition voice-recognition

c# - 如何获取语音数据？

在我的程序中，我可以使用用户的声音来获取词典、文本、单词等等。但是，有什么办法可以获取用户声音的音高吗？我正在使用带有c#的Windows语音API。以下是我用来获取语音数据的部分代码usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Speech.Recognition;usingSystem.Speech.Synthesis;usingSystem.Windows.Forms;usingSystem.IO;namespaceSpeech_Recognize

c#如何 System section sEngine .net windows speech-recognition

python - CNTK教程:"Hands-On Lab: Image recognition with Convolutional Networks, Batch Normalization, and Residual Nets"python问题

我正在尝试按照本教程进行操作:https://github.com/Microsoft/CNTK/wiki/Hands-On-Labs-Image-Recognition我现在正处于Frank所说的位置:“请执行以下两个Python脚本，您也可以在工作目录中找到它们:wget-rchttp://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gztarxvfwww.cs.toronto.edu/~kriz/cifar-10-python.tar.gzpythonCifarConverter.pycifar-10-batches-py我正在使用W

python Convolutional section cifar windows cntk