草庐IT

speech_recognition

全部标签

android - 如何在我的 flutter 项目中实现 flutter Text to Speech

我想在我的Flutter应用程序中实现CloudSpeech-to-Text(GoogleAPI)。您知道这是否可行吗?我在哪里可以获得一些有用的信息或如何操作的说明?谢谢:) 最佳答案 如果你想要语音转文本,使用android原生plastform-channels。链接:https://flutter.dev/docs/development/platform-integration/platform-channels流程:点击flutter按钮->android原生Speech-to-Textapi->flutter文本显示

Flutter speech_recognition 快速构建错误

我在使用flutterspeech_recognition包时遇到构建错误。立即尝试为iOS构建。尚未测试Android。我遵循了安装指南。该包似乎在修改.yaml文件后加载。我在MacBookPro上使用VisualStudioIDE。Launchinglib/main.dartoniPhoneXʀindebugmode...Xcodebuilddone.9.8sFailedtobuildiOSappErroroutputfromXcodebuild:↳**BUILDFAILED**Xcode'soutput:↳===BUILDTARGETspeech_recognitionOFPR

android - Flutter speech_recognition locale de_DE 不工作

我正在尝试使用de_DE作为语言环境,使用flutterspeech_recognizer将语音转为文本,但识别器返回法语。使用en_US它工作正常。我正在使用iPhone进行测试,没有模拟器。_speechRecognition.listen(locale:"de_DE").then((result)=>setState((){_textController.text=resultText;resultText="";}));我怎样才能做到这一点? 最佳答案 查看库的限制部分:https://github.com/rxlabz/s

dart - 在dart、flutter中使用gcloud speech api进行实时语音识别

我想在用dart编写的flutter项目中使用Google的实时语音识别api。我已经激活了一个gcloud帐户,创建了apikey(这应该是谷歌语音唯一必要的身份验证方法)并编写了一个基本的apk,它应该将音频流发送到谷歌云并显示响应。我导入了googleapis/speech和googleapis_auth插件。但我不知道如何设置它。他们说你必须使用gRPC,这是有道理的,因为它应该使它易于使用,但他们在github上的插件的实现似乎并没有使用它。那么谁能告诉我如何使用它-设置身份验证和转录语音? 最佳答案 更新:这是一个工作示

ios - 在 Swift 中有条件地导入一个基于 iOS 版本的框架(比如 Speech)?

有什么方法可以根据运行时iOS版本有条件地在Swift中导入框架?特别是,我有一个部署目标为iOS8的应用程序。我想在应用程序中使用新的AppleSpeech框架,如果它在运行时可用的话。我知道用于代码部分的#available(iOS10,*)指令,以及可用于整个代码段的@available(iOS10,*)指令类(class)。所以我可以很容易地避免执行任何使用语音框架的代码。但是在包含使用Speech的类的文件中,我需要“importSpeech”语句,而这两个指令都不能在那里使用。我发现,即使我的整个类(class)都有@available(iOS10,*)指令,当我在iOS9

ios - 如何在代理设置后面使用 Google Speech to Text API?

如何在iOS应用程序的代理设置后面使用GoogleSpeechToTextAPI?当我尝试在代理后面创建连接时,出现“无法创建子channel”错误。请提出解决此错误的任何解决方案。 最佳答案 根据thisanswerGoogle客户端(其中包括Speechtotext客户端)支持http_proxy或https_proxy环境变量。考虑使用Google云客户端连接到GoogleSpeechtotextAPI或查看代码并尝试实现类似的代理解决方案。这是Python客户端,还有其他语言的客户端https://github.com/go

go - 在 Google Cloud Speech to Text API v1p1beta1 RPC 中使用 AlternativeLanguageCodes

我正在使用其go客户端开发RPCv1p1beta1中的GoogleCloudSpeechtoTextAPI。API按预期工作,但如果在RecognitionConfig中设置了alternativeLanguageCodes,它不会回答。GoogleRecognitionConfig:&speech.StreamingRecognitionConfig{SingleUtterance:c.SingleUtterance,InterimResults:false,Config:&speech.RecognitionConfig{Encoding:speech.RecognitionCon

Google Speech - 流媒体请求返回 EOF 错误

我使用Go获取RTMP流,将其转码为FLAC(使用ffmpeg)并尝试流式传输到Google的SpeechAPI以转录音频。但是,我在发送数据时不断收到EOF错误。我在文档中找不到有关此错误的任何信息,因此我不确定是什么原因造成的。我将接收到的数据分block为3秒的片段(长度不相关,只要它小于流识别请求的最大长度)。这是我的代码的核心:funcmain(){done:=make(chanos.Signal)received:=make(chan[]byte)goreceive(received)gotranscribe(received)signal.Notify(done,os.I

python - 尝试使用 Google Cloud Speech API 时抛出 403

我将python与谷歌云语音api一起使用我在ubuntu和Windows上执行了“Howtousegooglespeechrecognitionapiinpython?”中的所有步骤,当我尝试从此处运行简单脚本时-“https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/api/speech_rest.py”我得到下一个错误:奇怪的是我没有名为“cloudsdktool”的项目我运行“gcloudinit”,并使用“gcloudauthactivate-service-account-

java - 有没有办法强制 Google Speech api 只返回单词作为响应?

我正在使用Google的这个api:-https://www.google.com/speech-api/v2/recognize?output=json&lang="+language_code+"&key="Mykey"用于语音识别,效果很好。问题在于数字,即如果我说一二三四结果将是1234如果我说1234,结果仍然是1234。另一个问题是,对于其他语言,即德语中的单词elf是eleven。如果你说elf结果是11,而不是elf。我知道我们无法控制api,但是我们可以添加任何参数或hack到这个api来强制它只返回单词。响应有时会产生正确的结果,但并非总是如此。这些是示例响应1)当