草庐IT

语音分离

全部标签

windows - 我可以直接使用 SAPI 将语音从存储的音频实时转换为文本吗

我真正想要实现的是这个-->假设我播放一个音频文件(使用我的应用程序),它可以从互联网流式传输/或直接从本地存储访问。现在我想将SAPI配置为收听此源而不是麦克风,并像往常一样将语音从音频转换为文本。 最佳答案 我不认为SAPI本身支持这个。您可以使用一些SAPI的“外部”方法:获取male-to-maleminiplugcable并将声卡的输出插入声卡的输入使用VirtualAudioCable它基本上达到了第一名,但使用的是虚拟声卡软件而不是硬件。一开始要了解虚拟音频电缆的工作原理和使用方法可能会非常棘手,但一旦您理解了它,它就

c# - 如何获取语音数据?

在我的程序中,我可以使用用户的声音来获取词典、文本、单词等等。但是,有什么办法可以获取用户声音的音高吗?我正在使用带有c#的Windows语音API。以下是我用来获取语音数据的部分代码usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Speech.Recognition;usingSystem.Speech.Synthesis;usingSystem.Windows.Forms;usingSystem.IO;namespaceSpeech_Recognize

Java 文字转语音我无法让它说话

我一直在尝试制作一个文本到语音程序,我在WindowsPC上仅供引用。我无法让我的程序说出我告诉它的内容。如果有人可以帮助我解决此问题或指出可以帮助我解决此问题的资源,我们将不胜感激importjava.awt.Color;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JCheckBox;importjavax.swing.JFrame;importjavax.swing.JPanel;importjavax

c# - 如何使用SAPI 5控制第三方文字转语音?

Windows包含SAPI5API,可让您控制TTS语音。但是我使用的是AcapelaPeter,它没有出现在窗口TTS对话框中。所以我不能将此语音与典型的.NETAPI一起使用(例如codeprojectapp)。然而,此文本文件附带的语音:VoiceDescriptions.txt似乎是我可以将其输入SAPI引擎以帮助它检测此语音的变量。所以我的问题是:如何使用此语音元数据通过SAPI生成语音?我已将所有引用文件与语音一起安装。我找到了SpVoiceWinAPI但它没有提到任何从文本加载元数据的方法。[LANG,British]@=eng.tmlPHOTREE=eng.trxPRO

python 3.x语音模块

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭7年前。Improvethisquestion是否有pyTTS或某种适用于python3.0的语音模块?我似乎无法在任何地方找到它,我真的很想尝试一下。

c# - 如何删除语音事件处理程序?

我正在编写以下代码SpeechRecognizersr2=newSpeechRecognizer();...sr2.SpeechRecognized+=newEventHandler(sr2_SpeechRecognized);...voidsr2_SpeechRecognized(objectsender,SpeechRecognizedEventArgse){}这里第一段代码显示了语音识别器的初始化,第二段代码显示了注册到事件处理程序,第三段代码显示了事件处理程序。现在,我需要删除这个事件处理程序。我该怎么做? 最佳答案 就用s

c# - 如何使用 Project Oxford 的语音 API 将解决方案实现到 WPF 应用程序中?

我一直无法找到链接未被破坏的相关文档。我想在我的WPF应用程序中实现ProjectOxford的SpeechAPI的所有API功能。这些功能包括添加、编辑和删除意图、实体、预建实体、短语列表。那么如何将所有这些控件引入我的WPF应用程序并能够实时使用SpeechAPI?非常感谢任何帮助,感谢您阅读我的问题。 最佳答案 我们刚刚将ProjectOxford重命名为MicrosoftCognitiveServices;我想知道这是否破坏了某些链接。(如果是这样,我们深表歉意!)所有API都列在https://www.microsoft.

linux - 分离模式下 matlab 脚本编辑器窗口标题上的文件名

我更喜欢使用与主窗口分离的Matlab脚本编辑器来编写代码。下面您只能看到脚本窗口:窗口标题显示文件的完整路径。是否可以只显示文件名?怎么办?附带问题:我如何知道正在编辑哪个文件? 最佳答案 顶部栏显示完整路径,在我看来这实际上是一个有用的功能。除非通过修改底层Java(这很可能违反MathWorks软件许可协议(protocol)),否则您不能在分离的编辑器中只有文件名。只有选项卡在主编辑器(不是分离的编辑器)中只显示文件名。如果您的选项卡在主编辑器中隐藏,您可以通过以下方式解决:View→TabPosition→Top(oran

windows - 使用 SAPI 创建个人语音识别系统

我正在使用给出的C++代码here.但是这里使用的共享语音识别运行它自己的命令,例如移动、最小化、删除。我需要在不调用MS语音识别程序的情况下创建它。hr=cpEngine.CoCreateInstance(CLSID_SpSharedRecognizer);上面这一行创建了共享实例。我尝试改用CLSID_SpInprocRecognizer但无法正确使用。我对此很陌生。有办法做到这一点吗? 最佳答案 我在这里遇到了同样的问题,并花了很多时间试图找到答案。幸运的是,我按照以下步骤找到了解决方案:如果您想摆脱MS语音识别程序,请使用进

asp.net - 您如何在 ASP.NET 解决方案中调用物理上分离的 UI/BL 代码?

Chapter19:PhysicalTiersandDeploymentMSDN上描述了“分布式部署”(见图2)。一切都很好。根据我的经验,我们总是按照他们所描述的“非分布式部署”来部署基于Web的系统(图1)。我的理解是,在Microsoft世界中,作为独立事物的“应用程序服务器”并不真正存在(就像在Java世界中一样),因为它实际上已“嵌入”到操作系统/Windows中。所以我的问题是,如果您要将UI和业务逻辑(BL)分布到不同的服务器/层上,它们将如何通信?我知道一个答案是使用“服务层”——有哪些替代方案?你实际上会怎么做?从代码的角度来看它会是什么样子?