Biblioteca de código abierto de reconocimiento de voz FastARS portado a la versión de desarrollo GEC6818

Portabilidad FastARS

Trasplantar e instalar fftw3

1. Descargue el código fuente 
wget -c http://www.fftw.org/fftw-3.3.10.tar.gz 
2.
Descomprima 
tar -xzvf fftw-3.3.10.tar.gz 
cd fftw-3.3.10 
/ 
3. Configure el entorno actual de ejecución y compilación 
export CC=arm-linux-gcc 
export CXX=arm-linux-g++ 
mkdir /usr/local/opt/fftw/ -p   
sudo chmod 777 /usr/local/opt/fftw/ 
. / configure --host=arm-linux --enable-shared --enable-float 
            --prefix=/usr/local/opt/fftw/ 
​4.
Compilar e instalar 
make   
make install

Portar OpenBLAS

1. Descargue el código fuente 
wget -c https://github.com/xianyi/OpenBLAS/releases/download/v0.3.20/OpenBLAS-0.3.20.tar.gz 
2.
Descomprima 
tar -xzvf OpenBLAS-0.3.20. tar .gz   
cd OpenBLAS-0.3.20 
    
3. Compile 
make TARGET=ARMV7 HOSTCC=gcc BINARY=32 CC=arm-linux-gcc FC=arm-linux-gfortran 
   
4. Instale 
sudo mkdir /usr/local/opt/openblas/ - p 
sudo make PREFIX=/usr/local/opt/openblas/install   

Portar FastARS

1. Descargue la última versión del código fuente 
git clone https://github.com/chenkui164/FastASR.git 
​2.
Compile la última versión del código fuente, 
cd FastASR/ 
mkdir build 
cd build

3. Escriba un script cmake para compilación cruzada

vi arm_linux_setup.cmake 
    
#Complete el siguiente contenido 
set(CMAKE_SYSTEM_NAME Linux) 
set(CMAKE_SYSTEM_PROCESSOR arm) 
set(CMAKE_C_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-gcc) 
set(CMAKE_CXX_COMPILER /usr/ local/ arm/5.4.0/usr/bin/arm-linux-g++)    
    
descripción del parámetro: CMAKE_C_COMPILER establece la ruta del compilador cruzado 
         CMAKE_CXX_COMPILER establece la ruta del compilador cruzado  

4. Generar script de archivo MAKE

cmake -DCMAKE_TOOLCHAIN_FILE=./arm_linux_setup.cmake ..

5. Compilar e instalar

hacer 
hacer instalar

6. Ingrese al directorio de ejemplos para ver si se generó con éxito

 

Portado a la placa de desarrollo GEC6818

1. Descargue el k2_rnnt2_cli generado al directorio /bin de la placa de desarrollo

2. Descargue todos los archivos de la biblioteca al directorio /lib de la placa de desarrollo

 

 

3. Descargue el modelo de red de voz a la versión de desarrollo (consulte el github del autor original para la conversión del modelo)

 

4. Prueba de uso

[root@GEC6818 /]#k2_rnnt2_cli /yyy my.wav    
El tiempo de audio es 5,029750 s. El len es 80476 
La inicialización del modelo tarda 9,790232 s. 
Resultado: "¿Has comido ya?" 
La inferencia del modelo tarda 18,692995 s. 
[root@GEC6818 /]# 
    
//descripción del comando 
k2_rnnt2_cli /yyy my.wav     
k2_rnnt2_cli: programa de reconocimiento de voz 
/yyy: vocab.txt wenet_params.bin directorio donde se almacena el modelo   
my.wav: archivo de audio a reconocer

PD: Debido a que la versión de desarrollo actual no tiene GPU y usa un compilador de 32 bits, el tiempo de reconocimiento es más largo.

Adjunto: Documentos relacionados que han sido trasplantados

Enlace: Baidu Netdisk Ingrese el código de extracción Código de extracción: 2333 --Compartir del super miembro V4 de Baidu Netdisk

Supongo que te gusta

Origin blog.csdn.net/qq_34548424/article/details/127843064
Recomendado
Clasificación