Portabilidad FastARS
Trasplantar e instalar fftw3
1. Descargue el código fuente wget -c http://www.fftw.org/fftw-3.3.10.tar.gz 2. Descomprima tar -xzvf fftw-3.3.10.tar.gz cd fftw-3.3.10 / 3. Configure el entorno actual de ejecución y compilación export CC=arm-linux-gcc export CXX=arm-linux-g++ mkdir /usr/local/opt/fftw/ -p sudo chmod 777 /usr/local/opt/fftw/ . / configure --host=arm-linux --enable-shared --enable-float --prefix=/usr/local/opt/fftw/ 4. Compilar e instalar make make install
Portar OpenBLAS
1. Descargue el código fuente wget -c https://github.com/xianyi/OpenBLAS/releases/download/v0.3.20/OpenBLAS-0.3.20.tar.gz 2. Descomprima tar -xzvf OpenBLAS-0.3.20. tar .gz cd OpenBLAS-0.3.20 3. Compile make TARGET=ARMV7 HOSTCC=gcc BINARY=32 CC=arm-linux-gcc FC=arm-linux-gfortran 4. Instale sudo mkdir /usr/local/opt/openblas/ - p sudo make PREFIX=/usr/local/opt/openblas/install
Portar FastARS
1. Descargue la última versión del código fuente git clone https://github.com/chenkui164/FastASR.git 2. Compile la última versión del código fuente, cd FastASR/ mkdir build cd build
3. Escriba un script cmake para compilación cruzada
vi arm_linux_setup.cmake #Complete el siguiente contenido set(CMAKE_SYSTEM_NAME Linux) set(CMAKE_SYSTEM_PROCESSOR arm) set(CMAKE_C_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-gcc) set(CMAKE_CXX_COMPILER /usr/ local/ arm/5.4.0/usr/bin/arm-linux-g++) descripción del parámetro: CMAKE_C_COMPILER establece la ruta del compilador cruzado CMAKE_CXX_COMPILER establece la ruta del compilador cruzado
4. Generar script de archivo MAKE
cmake -DCMAKE_TOOLCHAIN_FILE=./arm_linux_setup.cmake ..
5. Compilar e instalar
hacer hacer instalar
6. Ingrese al directorio de ejemplos para ver si se generó con éxito
Portado a la placa de desarrollo GEC6818
1. Descargue el k2_rnnt2_cli generado al directorio /bin de la placa de desarrollo
2. Descargue todos los archivos de la biblioteca al directorio /lib de la placa de desarrollo
3. Descargue el modelo de red de voz a la versión de desarrollo (consulte el github del autor original para la conversión del modelo)
4. Prueba de uso
[root@GEC6818 /]#k2_rnnt2_cli /yyy my.wav El tiempo de audio es 5,029750 s. El len es 80476 La inicialización del modelo tarda 9,790232 s. Resultado: "¿Has comido ya?" La inferencia del modelo tarda 18,692995 s. [root@GEC6818 /]# //descripción del comando k2_rnnt2_cli /yyy my.wav k2_rnnt2_cli: programa de reconocimiento de voz /yyy: vocab.txt wenet_params.bin directorio donde se almacena el modelo my.wav: archivo de audio a reconocer
PD: Debido a que la versión de desarrollo actual no tiene GPU y usa un compilador de 32 bits, el tiempo de reconocimiento es más largo.
Adjunto: Documentos relacionados que han sido trasplantados
Enlace: Baidu Netdisk Ingrese el código de extracción Código de extracción: 2333 --Compartir del super miembro V4 de Baidu Netdisk