语音识别开源库 FastARS 移植到GEC6818开发版

留码不留名 2023-04-12 原文

FastARS 移植

移植安装fftw3

1.下载源码
wget -c http://www.fftw.org/fftw-3.3.10.tar.gz

2.解压
tar -xzvf fftw-3.3.10.tar.gz 
cd fftw-3.3.10/

3.配置当前的运行编译环境 
export CC=arm-linux-gcc
export CXX=arm-linux-g++
mkdir  /usr/local/opt/fftw/  -p  
sudo chmod  777  /usr/local/opt/fftw/
./configure --host=arm-linux --enable-shared --enable-float
            --prefix=/usr/local/opt/fftw/

4.编译安装 
make  
make install

移植 OpenBLAS

1.下载源码
wget -c https://github.com/xianyi/OpenBLAS/releases/download/v0.3.20/OpenBLAS-0.3.20.tar.gz

2.解压
tar -xzvf OpenBLAS-0.3.20.tar.gz  
cd OpenBLAS-0.3.20
    
3.编译 
make TARGET=ARMV7 HOSTCC=gcc BINARY=32 CC=arm-linux-gcc FC=arm-linux-gfortran
   
4.安装 
sudo mkdir  /usr/local/opt/openblas/  -p 
sudo make PREFIX=/usr/local/opt/openblas/ install

移植 FastARS

1.下载最新版的源码
git clone https://github.com/chenkui164/FastASR.git

2.编译最新版的源码，
cd FastASR/
mkdir build
cd build

3.编写交叉编译的cmake 脚本

vi  arm_linux_setup.cmake
    
#填写如下内容 
set(CMAKE_SYSTEM_NAME Linux)
set(CMAKE_SYSTEM_PROCESSOR arm)
set(CMAKE_C_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-gcc)
set(CMAKE_CXX_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-g++)   
    
参数说明: CMAKE_C_COMPILER  设置交叉编译器的路径 
         CMAKE_CXX_COMPILER 设置交叉编译器的路径

4.生成makefile 脚本

cmake -DCMAKE_TOOLCHAIN_FILE=./arm_linux_setup.cmake ..

5.编译安装

make 
make install

6.进入 examples 目录看看是否成功生成

移植到GEC6818开发板

1.把生成的 k2_rnnt2_cli 下载到开发板的 /bin 目录

2.把所有的库文件下载到开发板的 /lib 目录

3.下载语音网络模型到开发版中 (模型转换请看原作者github)

4.测试使用

[root@GEC6818 /]#k2_rnnt2_cli    /yyy  my.wav   
Audio time is 5.029750 s. len is 80476
Model initialization takes 9.790232s.
Result: "你吃饭了吗".
Model inference takes 18.692995s.
[root@GEC6818 /]#
    
//命令说明
k2_rnnt2_cli    /yyy  my.wav    
k2_rnnt2_cli : 语音识别程序 
/yyy         : vocab.txt  wenet_params.bin  模型所存放的目录  
my.wav       : 需要识别的音频文件

PS:因为当前的开发版没有GPU 且使用的是32位的编译器，所以识别时间较长。

附件:已经移植好的相关文件

链接：百度网盘请输入提取码提取码：2333 --来自百度网盘超级会员V4的分享

移植 FastARS pre linux 语音识别 arm开发

有关语音识别开源库 FastARS 移植到GEC6818开发版的更多相关文章

报告回顾丨模型进化狂飙，DetectGPT能否识别最新模型生成结果？ - 2
导读语言模型给我们的生产生活带来了极大便利，但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT：判断文本是否为机器生成的工具」中，主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具，它可以帮助我们更好地分辨文章的来源和可信度，对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能，实现和效果等展开。（文末点击“阅读原文”，查看活动回放。）Ericmitchell斯坦福大学计算机系四年级博士生，由ChelseaFinn和Chri
[Vuforia]二.3D物体识别 - 2
之前说过10之后的版本没有3dScan了，所以还是9.8的版本或者之前更早的版本。 3d物体扫描需要先下载扫描的APK进行扫面。首先要在手机上装一个扫描程序，扫描现实中的三维物体，然后上传高通官网，在下载成UnityPackage类型让Unity能够使用这个扫描程序可以从高通官网上进行下载，是一个安卓程序。点到Tools往下滑，找到VuforiaObjectScanner下载后解压数据线连接手机，将apk文件拷入手机安装然后刚才解压文件中的Media文件夹打开，两个PDF图打印第一张A4-ObjectScanningTarget.pdf，主要是用来辅助扫描的。好了，接下来就是扫描三维物体。将瓶
ruby-on-rails - 在 heroku 的 .fonts 文件夹中包含自定义字体，似乎无法识别它们 - 2
Heroku支持人员告诉我，为了在我的Web应用程序中使用自定义字体(未安装在系统中，您可以在bash控制台中使用fc-list查看已安装的字体)我必须部署一个包含所有字体的.fonts文件夹里面的字体。问题是我不知道该怎么做。我的意思是，我不知道文件名是否必须遵循heroku的任何特殊模式，或者我必须在我的代码中做一些事情来考虑这种字体，或者如果我将它包含在文件夹中它是自动的......事实是，我尝试以不同的方式更改字体的文件名，但根本没有使用该字体。为了提供更多详细信息，我们使用字体的过程是将PDF转换为图像，更具体地说，使用rghostgem。并且最终图像根本不使用自定义字体。在
ruby-on-rails - 没有这样的文件或目录 - 用 Mini Magick 识别 - 2
在我让另一个人重做我的前端UI之前，我的Rails应用程序运行平稳。我已经尝试解决此错误3天了。这是错误:Nosuchfileordirectory-identifyExtractedsource(aroundline#59):575859606162@post=Post.find(params[:id])authorize@postif@post.update_attributes(post_params)flash[:notice]="Postwasupdated."redirect_to[@topic,@post]else{"utf8"=>"✓","_method"=>"patc
ruby-on-rails - 可移植 Ruby on Rails 环境 - 2
我给自己买了一个新的8gigUSBkey，我正在寻找一个合适的解决方案来拥有一个可移植RoR环境来学习。我在谷歌上搜索了一下，发现了一些可能性，但我很想听听一些现实生活中的经历和意见。谢谢! 最佳答案我喜欢InstantRails，非常容易使用，无需安装程序，也不会修改您的系统环境。关于ruby-on-rails-可移植RubyonRails环境，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/q
ruby - 使用 ruby 识别阵列上的运行 - 2
如果我们有一个数组array=[1,1,0,0,2,3,0,0,0,3,3,3]我们如何识别给定数字的运行(具有相同值的连续数字的数量)？例如:run_pattern_for(array,0)->2run_pattern_for(array,3)->1run_pattern_for(array,1)->1run_pattern_for(array,2)->0没有2的运行，因为没有连续出现2。3有一个运行，因为只有一个幻影以树为连续数字。最佳答案尝试:classArraydefcount_runs(element)chunk{|n
最新版人脸识别小程序图片识别生成二维码签到地图上选点进行位置签到计算签到距离课程会议活动打卡日常考勤上课签到打卡考勤口令签到 - 2
技术选型1，前端小程序原生MINA框架cssJavaScriptWxml2，管理后台云开发Cms内容管理系统web网页3，数据后台小程序云开发云函数云开发数据库（基于MongoDB）云存储4，人脸识别算法基于百度智能云实现人脸识别一，用户端效果图预览老规矩我们先来看效果图，如果效果图符合你的需求，就继续往下看，如果不符合你的需求，可以跳过。1-1，登录注册页可以看到登录页有注册入口，注册页如下我们的注册，需要管理员审核，审核通过后才可以正常登录使用小程序1-2，个人中心页登录成功以后，我们会进入个人中心页我们在个人中心页可以注册人脸，因为我们做人脸识别签到，需要先注册人脸才可以进行人脸比对，进
ruby-on-rails - 尝试登录和使用 heroku 时无法识别 ruby.exe - 2
当尝试创建一个heroku应用程序并通过git推送到它时，我收到以下错误:$herokucreate'"C:\ProgramFiles\ruby-1.9.2\bin\ruby.exe"isnotrecognizedasaninternalorexternalcommand,operableprogramorbatchfile.但是，$ruby-vruby1.9.3p125[i386-mingw32]我已经检查了PATH环境，它肯定包含“C:\ProgramFiles(x86)\ruby-1.9.2\bin”。同样有趣的是，当导航到该目录时，它实际上并不包含名为ruby.exe的文件
基于Python的人脸识别课堂系统（毕设）——附录上 - 2
本文章承接《基于Python的人脸识别课堂考勤系统（毕设）》，填坑上篇文章遗留的代码部分。因为项目分的模块比较多，再加上本人能力有限，所以代码过于臃肿还存在许多优化的地方。同样本篇文章也仅适用于小白，零基础人群。PS：每个文件之中代码都已经区分开来，可以对照左侧目录部分实现快速预览! 由于代码过于多我这里分成上，下两个部分来发布吧！一、主文件importosimportsysimportrandomimportpymysqlimportcv2importnumpyasnpfrommathimportpifrommatplotlibimportpyplotaspltfromPILimpor
焕新古文化传承之路，AI为古彝文识别赋能 - 2
目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息：古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字，区别于现代意义上的彝文，古彝文指的是在民间流通使用的原生态彝文，多达87046字。古彝文的起源距今至少数千年，是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍，更深层、透彻地作用于传统文化保护。古彝文字义对照图（网络资料+邵文苑供图）古籍是不可再生的宝贵资源，应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、