草庐IT

语音转文字

全部标签

windows - 我可以直接使用 SAPI 将语音从存储的音频实时转换为文本吗

我真正想要实现的是这个-->假设我播放一个音频文件(使用我的应用程序),它可以从互联网流式传输/或直接从本地存储访问。现在我想将SAPI配置为收听此源而不是麦克风,并像往常一样将语音从音频转换为文本。 最佳答案 我不认为SAPI本身支持这个。您可以使用一些SAPI的“外部”方法:获取male-to-maleminiplugcable并将声卡的输出插入声卡的输入使用VirtualAudioCable它基本上达到了第一名,但使用的是虚拟声卡软件而不是硬件。一开始要了解虚拟音频电缆的工作原理和使用方法可能会非常棘手,但一旦您理解了它,它就

c# - 如何获取语音数据?

在我的程序中,我可以使用用户的声音来获取词典、文本、单词等等。但是,有什么办法可以获取用户声音的音高吗?我正在使用带有c#的Windows语音API。以下是我用来获取语音数据的部分代码usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Speech.Recognition;usingSystem.Speech.Synthesis;usingSystem.Windows.Forms;usingSystem.IO;namespaceSpeech_Recognize

Java 文字转语音我无法让它说话

我一直在尝试制作一个文本到语音程序,我在WindowsPC上仅供引用。我无法让我的程序说出我告诉它的内容。如果有人可以帮助我解决此问题或指出可以帮助我解决此问题的资源,我们将不胜感激importjava.awt.Color;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JCheckBox;importjavax.swing.JFrame;importjavax.swing.JPanel;importjavax

c# - 如何使用SAPI 5控制第三方文字转语音?

Windows包含SAPI5API,可让您控制TTS语音。但是我使用的是AcapelaPeter,它没有出现在窗口TTS对话框中。所以我不能将此语音与典型的.NETAPI一起使用(例如codeprojectapp)。然而,此文本文件附带的语音:VoiceDescriptions.txt似乎是我可以将其输入SAPI引擎以帮助它检测此语音的变量。所以我的问题是:如何使用此语音元数据通过SAPI生成语音?我已将所有引用文件与语音一起安装。我找到了SpVoiceWinAPI但它没有提到任何从文本加载元数据的方法。[LANG,British]@=eng.tmlPHOTREE=eng.trxPRO

python 3.x语音模块

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭7年前。Improvethisquestion是否有pyTTS或某种适用于python3.0的语音模块?我似乎无法在任何地方找到它,我真的很想尝试一下。

c# - 如何删除语音事件处理程序?

我正在编写以下代码SpeechRecognizersr2=newSpeechRecognizer();...sr2.SpeechRecognized+=newEventHandler(sr2_SpeechRecognized);...voidsr2_SpeechRecognized(objectsender,SpeechRecognizedEventArgse){}这里第一段代码显示了语音识别器的初始化,第二段代码显示了注册到事件处理程序,第三段代码显示了事件处理程序。现在,我需要删除这个事件处理程序。我该怎么做? 最佳答案 就用s

c# - 如何使用 Project Oxford 的语音 API 将解决方案实现到 WPF 应用程序中?

我一直无法找到链接未被破坏的相关文档。我想在我的WPF应用程序中实现ProjectOxford的SpeechAPI的所有API功能。这些功能包括添加、编辑和删除意图、实体、预建实体、短语列表。那么如何将所有这些控件引入我的WPF应用程序并能够实时使用SpeechAPI?非常感谢任何帮助,感谢您阅读我的问题。 最佳答案 我们刚刚将ProjectOxford重命名为MicrosoftCognitiveServices;我想知道这是否破坏了某些链接。(如果是这样,我们深表歉意!)所有API都列在https://www.microsoft.

windows - 使用 SAPI 创建个人语音识别系统

我正在使用给出的C++代码here.但是这里使用的共享语音识别运行它自己的命令,例如移动、最小化、删除。我需要在不调用MS语音识别程序的情况下创建它。hr=cpEngine.CoCreateInstance(CLSID_SpSharedRecognizer);上面这一行创建了共享实例。我尝试改用CLSID_SpInprocRecognizer但无法正确使用。我对此很陌生。有办法做到这一点吗? 最佳答案 我在这里遇到了同样的问题,并花了很多时间试图找到答案。幸运的是,我按照以下步骤找到了解决方案:如果您想摆脱MS语音识别程序,请使用进

c++ - 带有 _T 宏的 C++ 中的字符串文字

这之间有什么区别(如果有的话)_T("astring")和_T('astring')? 最佳答案 首先,_T不是C++的标准部分。我已将“windows”标签添加到您的问题中。现在,它们之间的区别在于第一个是正确的而第二个不是。在C++中,'用于引用单个字符,"用于引用字符串。 关于c++-带有_T宏的C++中的字符串文字,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/92780

c++ - 如何在 visual studio(c++) 中将文字中文字符串分配给 wchar_t*?

我正在尝试在visualstudioforC++的Windows测试应用程序中编译以下代码:constwchar_t*chinese="好久不见";但是我得到以下错误:errorC2440:'initializing':cannotconvertfrom'constchar[5]'to'constwchar_t*我正在用unicode编译,所以我对此感到困惑。如果我像这样转换文字,错误就会消失:constwchar_t*chinese=(wchar_t*)"好久不见";我不确定这样做是否安全,我也不想这样做,所以我该如何解决这个问题。谢谢! 最佳答案