草庐IT

python使用VOSK实现离线语音识别(中文普通话)

目标:一个代码简单,离线,可直接使用,常用语句准确率还不错,免费的,普通话语音转文本的工具几番对比下来,VSOK基本满足我的需求,记录一下。环境windows10/python3.8.10s1安装vosk>pipinstallvosks2下载模型两个模型,一个很小,文件名中带有small字样,另一个就很大了,就我自己测试起来,small也够用官网下载地址:https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip41.87Mhttps://alphacephei.com/vosk/models/vosk-model-cn-0

在Unity中使用Vosk实现语音识别

集成步骤导入vosk-untiy-asr至项目在Github上下载vosk-unity-asr,解压后将下图三个文件夹复制到自己的项目中下载语言模型有两个语言模型可供下载,以轻量级语言模型vosk-model-small-cn-0.22.zip为例,下载后放入Assets\StreamingAssets文件夹下新建空对象,挂载相关脚本,设置如下VoiceProcessor:输入音频处理脚本VoskSpeechToText:语音转文字脚本VoskResultText:根据识别结果执行对应逻辑脚本问题及解决改为中文的模型包之后运行闪退原因:值填写不正确导致解决:值填写为:vosk-model-sm

开源VOSK引擎免费语音转文字部署

步骤1:安装Python3环境前往 DownloadPython|Python.org 下载Windows环境版本(Python3.8以上)。安装过程中选中“AddPythondirectoryto'PATH'environmentvariable”。选中之后,Python可以像系统自带命令一样,在所有CMD目录下运行。否则每次执行Python都需要输入它的目录位置。其他选项按默认即可。(可选操作)步骤1a:替换下载镜像为清华大学镜像源在命令行输入pipconfigsetglobal.index-url SimpleIndex这样对于国内用户来说下载速度会更快步骤2:安装VOSKAPI库打开C

开源VOSK引擎免费语音转文字部署

步骤1:安装Python3环境前往 DownloadPython|Python.org 下载Windows环境版本(Python3.8以上)。安装过程中选中“AddPythondirectoryto'PATH'environmentvariable”。选中之后,Python可以像系统自带命令一样,在所有CMD目录下运行。否则每次执行Python都需要输入它的目录位置。其他选项按默认即可。(可选操作)步骤1a:替换下载镜像为清华大学镜像源在命令行输入pipconfigsetglobal.index-url SimpleIndex这样对于国内用户来说下载速度会更快步骤2:安装VOSKAPI库打开C

springboot整合vosk实现简单的语音识别功能

vosk开源语音识别Vosk是开源的语音识别工具包。Vosk支持的事情包括:支持十九种语言-中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯,希腊语,波斯语,菲律宾语,乌克兰语,哈萨克语。移动设备上脱机工作-RaspberryPi,Android,iOS。使用简单的pip3installvosk安装。每种语言的手提式模型只有是50Mb,但还有更大的服务器模型可用。提供流媒体API,以提供最佳用户体验(与流行的语音识别python包不同)。还有用于不同编程语言的包装器-java/csharp/javascript等。可以快速重新