语音识别开源库 FastARS 移植到GEC6818开发版

FastARS 移植

移植 安装fftw3

1.下载源码
wget -c http://www.fftw.org/fftw-3.3.10.tar.gz
​
2.解压
tar -xzvf fftw-3.3.10.tar.gz 
cd fftw-3.3.10/
​
3.配置当前的运行编译环境 
export CC=arm-linux-gcc
export CXX=arm-linux-g++
mkdir  /usr/local/opt/fftw/  -p  
sudo chmod  777  /usr/local/opt/fftw/
./configure --host=arm-linux --enable-shared --enable-float
            --prefix=/usr/local/opt/fftw/
​
4.编译安装 
make  
make install 

移植 OpenBLAS

1.下载源码
wget -c https://github.com/xianyi/OpenBLAS/releases/download/v0.3.20/OpenBLAS-0.3.20.tar.gz
​
2.解压
tar -xzvf OpenBLAS-0.3.20.tar.gz  
cd OpenBLAS-0.3.20
    
3.编译 
make TARGET=ARMV7 HOSTCC=gcc BINARY=32 CC=arm-linux-gcc FC=arm-linux-gfortran
   
4.安装 
sudo mkdir  /usr/local/opt/openblas/  -p 
sudo make PREFIX=/usr/local/opt/openblas/ install   

移植 FastARS

1.下载最新版的源码
git clone https://github.com/chenkui164/FastASR.git
​
2.编译最新版的源码,
cd FastASR/
mkdir build
cd build

3.编写交叉编译的cmake 脚本

vi  arm_linux_setup.cmake
    
#填写如下内容 
set(CMAKE_SYSTEM_NAME Linux)
set(CMAKE_SYSTEM_PROCESSOR arm)
set(CMAKE_C_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-gcc)
set(CMAKE_CXX_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-g++)   
    
参数说明: CMAKE_C_COMPILER  设置交叉编译器的路径 
         CMAKE_CXX_COMPILER 设置交叉编译器的路径  

4.生成makefile 脚本

cmake -DCMAKE_TOOLCHAIN_FILE=./arm_linux_setup.cmake ..

5.编译安装

make 
make install 

6.进入 examples 目录看看是否成功生成

移植到GEC6818开发板

1.把生成的 k2_rnnt2_cli 下载到开发板的 /bin 目录

2.把所有的库文件下载到开发板的 /lib 目录

 

3.下载语音网络模型到开发版中 (模型转换请看原作者github)

4.测试使用

[root@GEC6818 /]#k2_rnnt2_cli    /yyy  my.wav   
Audio time is 5.029750 s. len is 80476
Model initialization takes 9.790232s.
Result: "你吃饭了吗".
Model inference takes 18.692995s.
[root@GEC6818 /]#
    
//命令说明
k2_rnnt2_cli    /yyy  my.wav    
k2_rnnt2_cli : 语音识别程序 
/yyy         : vocab.txt  wenet_params.bin  模型所存放的目录  
my.wav       : 需要识别的音频文件

PS:因为当前的开发版没有GPU 且使用的是32位的编译器,所以识别时间较长。

附件:已经移植好的相关文件

链接:百度网盘 请输入提取码 提取码:2333 --来自百度网盘超级会员V4的分享

猜你喜欢

转载自blog.csdn.net/qq_34548424/article/details/127843064
今日推荐